先举个例子:
re.findall('(A{0,})', 'AAAA')
# ['AAAA', '']
2.
re.findall('((A{0,})+)', 'AAAA')
# [('AAAA', ''), ('', '')]
3.
re.findall('((A{1,})+)', 'AAAA')
# [('AAAA', 'AAAA')]
我有两个问题:
1、例2和例3中,无论{0,}还是{1,}都是贪婪的,为何(A{0,})只匹配到一个空字符'',而(A{1,})却匹配到'AAAA'?
2、例1中,正则已经匹配了字符串'AAAA',为何还会匹配到一个空字符''?(例2中也匹配到('', ''))
请问以上两个现象内在逻辑是什么?
例 1
A{0,}
匹配字符 A{0,}
匹配 0 次至无穷次所以匹配到一个空字符例 2
你在
(A{0,})+
的外面又加了个捕获组,由于循环捕获组只捕获最后一次匹配,所以匹配 2 的捕获组都是空字符例 3
这就没啥说的了,少了匹配空字符的过程,但是由于你是循环捕获,所以出现了两个“AAAA”