正则表达式解析结果和预期不符，但看不出错在哪里了

发布于
2017-07-11

>>> import re
>>> RE_FUNCTION_PARAM_NAME = '[\,\(;]\s*(.*?)\s*[\,:]'
>>> testStr = 'function Func(i: Integer; s1, s2,s3,s4: string): Boolean;'
>>> pattern = re.compile(RE_FUNCTION_PARAM_NAME)
>>> print pattern.findall(testStr)
['i', 's1', 's3']
>>>

上面这段Python脚本，希望解析出testStr中的i、s1、s2、s3、s4

但是实际解析结果只有i、s1、s3

正确的正则表达式应该是什么样的？

python 正则表达式

阅读 3k

3 个回答

luckness

✓ 已被采纳

可以使用'[,(;]\s*(.*?)\s*(?=[,:])'。

,(;:在[]里面不是特殊字符，所以不用转义，当然转义了也没事；
你的正则的问题是正则最后会匹配一个逗号或者分号，所以下次匹配是从逗号或者分号的位置之后匹配的，所以当匹配成功s1之后，是从 s2,s3,s4: string): Boolean;'这个位置开始匹配的，因为开头的,号已经被s1匹配走了，所以下一次匹配是从s2后面的逗号开始的，所以s2匹配不上，同理s4前面的逗号让s3匹配走了，所以s4没有匹配上。

所以，我用断言匹配后面的逗号或分号。

Update1:
不用断言，可以使用这个

'[,(;]\s*([^,:\s)]+)'

因为变量名后面是空格或者逗号或者冒号或右括号，所以匹配的时候匹配[^,:\s]+，即一到多个非空格，逗号，冒号和右括号的字符就行了。

Lin_R

5.2k1719

发布于
2017-07-11

可以试下代码：

RE_FUNCTION_PARAM_NAME = '[,(;]\s*(.*?)\s*(?=[ \,:])'

原来的正则失败，原因在于后面的[\,:]，因为正则在匹配的过程中，会有一个消费字符的过程，意思就是说，假设我匹配的这个字符，不管这个字符是不是我想要的，我都是消费了，在下次匹配就不会重复考虑，所以我用了零宽断言，这样就能光匹配但不消费，所以上一轮用于匹配的字符，在下一轮还能够继续使用

kushao1267

141

发布于
2017-07-11

更新于
2017-07-11

import re
RE_FUNCTION_PARAM_NAME = r'[(,\s]?([\d\w]+)[,:]'
testStr = 'function Func(i: Integer; s1, s2,s3,s4: string): Boolean;'
pattern = re.compile(RE_FUNCTION_PARAM_NAME)

print pattern.findall(testStr)

-> python test.py
['i', 's1', 's2', 's3', 's4']

直接用pattern用r''可以免去转义符号的烦恼了。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

正则表达式解析结果和预期不符，但看不出错在哪里了

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？