[python]关于正则,一个捕获组内贪婪套贪婪的返回与预期不符

先举个例子:

re.findall('(A{0,})', 'AAAA')
# ['AAAA', '']

2.

re.findall('((A{0,})+)', 'AAAA')
# [('AAAA', ''), ('', '')]

3.

re.findall('((A{1,})+)', 'AAAA')
# [('AAAA', 'AAAA')]

我有两个问题:

1、例2和例3中,无论{0,}还是{1,}都是贪婪的,为何(A{0,})只匹配到一个空字符'',而(A{1,})却匹配到'AAAA'?

2、例1中,正则已经匹配了字符串'AAAA',为何还会匹配到一个空字符''?(例2中也匹配到('', ''))

请问以上两个现象内在逻辑是什么?

阅读 1.3k
1 个回答

例 1

  • A{0,} 匹配字符 A
  • {0,} 匹配 0 次至无穷次所以匹配到一个空字符

例 1

例 2

你在(A{0,})+的外面又加了个捕获组,由于循环捕获组只捕获最后一次匹配,所以匹配 2 的捕获组都是空字符
例 2

例 3

这就没啥说的了,少了匹配空字符的过程,但是由于你是循环捕获,所以出现了两个“AAAA”
例 3

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏