关于python网络数据采集的匹配内链的正则表达式的问题

Question

新手上路，请多包涵

我查看了re的python文档发现对于|的匹配是从左到右的，可是其中下方源码未按期望的那样得出结果

bsObj.findAll("a", href=re.compile("^(/|.*"+includeUrl+")"))

import re

def matchstr(str,str1):
    regex = re.compile("^(/|.*"+str1+")")
    print(regex.match(str))
    
print(matchstr("/url","url"))

<_sre.SRE_Match object; span=(0, 1), match='/'>
None

期望能够匹配整个“/url”，但结果并没有，想搞清原因

是因为A|B中.*url整个作为B吗?

阅读 1.2k

撰写回答

推荐问题

相似问题

找不到问题？创建新问题