Python re.sub() 的一个奇怪问题?

问题已解决,我错误地理解了捕获的概念,代码改成如下形式则得到预期结果:

>>> def mark(mo):
            print(mo.group(1))
            return mo.group(1)

>>> re.sub(r'@(yangxg|zengshao|zmrenwu)', mark, '@yangxg @zengshao @zmrenwu')
>>> def mark(mo):
            print(mo.group(1))
            return mo.group(1)

>>> re.sub(r'@(yangxg)|@(zengshao)|@(zmrenwu)', mark, '@yangxg @zengshao @zmrenwu')
yangxg
None
None

可见第二次和第三次替换时 mo.group(1) 为 None 了,但我在正则表达式中指定了捕获组的,而且第一次捕获正常,是什么原因?

原本的的意图去掉每个用户名前的 @ 符号,期望的输出应该是:yangxg zengshao zmrenwu

阅读 4.8k
4 个回答

匹配到第二个括号的时候 值是 mo.group(2)

mo.group(1) 没匹配到就 None

def mark(mo):
    # print(mo.group(1))
    for i in range(1, 4):
        match_result = mo.group(i)
        if match_result is not None:
            print(i)
            return match_result


re_sub = re.sub(r'@(yangxg)|@(zengshao)|@(zmrenwu)', mark, '@yangxg @zengshao @zmrenwu')
print(re_sub)

这样写或许比较好些?输出符合你的要求

def mark(mo):
    print(mo.group(1))
    return mo.group(1)[1:]

data = re.sub(r'(@\w+)', mark, '@yangxg @zengshao @zmrenwu')
print data
import re
data = re.sub(r'@(\w+)', '\\1','@yangxg @zengshao @zmrenwu')
print data
result = re.sub(r'@(\w+)', lambda mo: mo.group(1), '@yangxg @zengshao @zmrenwu')
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题