Python正则r'\s+'与r'(\s+)'的区别

发布于
2014-01-02

上代码:

import re
s = 'a b c d e'
re.split(r'\s+', s)      # 结果: ['a', 'b', 'c', 'd', 'e']
re.split(r'(\s+)', s)    # 结果: ['a', ' ', 'b', ' ', 'c', ' ', 'd', ' ', 'e']

感觉与正则引擎规则有关.这其中差别的原因到底是因为什么？求指教.

python

阅读 18.6k

2 个回答

✓ 已被采纳

如评论所说，看过文档了你还问？！

再来一个例子，可以帮助更好的理解这个问题：

>>> s = 'a12b12c'
>>> re.split(r'(1)(2)', s)
['a', '1', '2', 'b', '1', '2', 'c']
>>> re.split(r'((1)(2))', s)
['a', '12', '1', '2', 'b', '12', '1', '2', 'c']

如果你的正则表达式中确实必须使用括号，但又不想把括号匹配到的部分包含在结果当中，记得使用非捕获分组(non-capturing group)的语法：

>>> re.split(r'(?:1)(2)', s)
['a', '2', 'b', '2', 'c']

Theo

2.6k124

发布于
2014-01-02

http://docs.python.org/2/library/re.html#re.split

If capturing parentheses are used in pattern, then the text of all groups in the pattern are also returned as part of the resulting list.

这个问题已经被关闭无法回答

推荐问题

相似问题

找不到问题？创建新问题

Python正则r'\s+'与r'(\s+)'的区别

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？