新手上路，请多包涵

re.sub('a(b)','d','abc') 产量 dc ，而不是 adc 。

为什么 re.sub 替换了整个捕获组，而不只是捕获组’(b)‘？

原文由 Nick 发布，翻译遵循 CC BY-SA 4.0 许可协议

python 正则表达式 python-3.x replace capturing-group

阅读 903

2 个回答

得票最新

社区维基

发布于
2022-11-16

✓ 已被采纳

因为它应该替换整个出现的模式：

返回通过用替换 repl 替换 string 中最左边的非重叠模式而获得的字符串。

如果它只替换一些子组，那么具有多个组的复杂正则表达式将无法工作。有几种可能的解决方案：

完整指定模式： re.sub('ab', 'ad', 'abc') 我最喜欢的，因为它非常易读和明确。
捕获要保留的组，然后在模式中引用它们（注意它应该是原始字符串以避免转义）： re.sub('(a)b', r'\1d', 'abc')
与前面的选项类似：提供回调函数作为 repl 参数并使其处理 Match 对象并返回所需的结果。
使用 lookbehinds/lookaheds，它们不包含在匹配中，但会影响匹配： re.sub('(?<=a)b', r'd', 'abxb') yields adxb 。该组开头的 ?<= 说“这是一个前瞻”。

原文由 yeputons 发布，翻译遵循 CC BY-SA 3.0 许可协议

社区维基

发布于
2022-11-16

我知道这不是严格回答 OP 问题，但这个问题很难用谷歌搜索（被 \1 解释淹没……）

对于那些像我一样来到这里的人，因为他们想实际用字符串替换不是第一个的捕获组，而不需要对字符串或正则表达式有特殊了解：

 #find offset [start, end] of a captured group within string
r = regex.search(oldText).span(groupNb)
#slice the old string and insert replacementText in the middle
newText = oldText[:r[0]] + replacementText + oldText[r[1]:]

我知道这是想要的行为，但我仍然不明白为什么 re.sub 不能指定它应该替换的实际捕获组……

原文由 Mr Buisson 发布，翻译遵循 CC BY-SA 4.0 许可协议

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Stack Overflow 翻译

子站问答

访问

本篇内容翻译自 Stack Overflow，如果你觉得翻译结果值得改进，欢迎直接编辑修改，感谢你为社区贡献。

相似问题

找不到问题？创建新问题

为什么 re.sub 会替换整个模式，而不仅仅是其中的一个捕获组？

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？

Stack Overflow 翻译