python正则表达式

“srcset=\"https://images/816057/photo-816057.jpeg?h=350&auto=compress&...”

在很多类似代码中，我需要匹配出https://images/816057/photo-816057.jpeg或是以jpg结尾的字符串。

我写的代码

patten = r'(?<=srcset=\\")http.+?(.jpeg|.jpg)'

res = re.findall(patten,str)

但是结果是['.jpeg', '.jpeg', '.jpeg', '.jpg']，请问下各位该怎么解决

阅读 2.1k

2 个回答

得票最新

✓ 已被采纳

p = re.compile('(?<=srcset=\\")(http.*?(?:.jpeg|.jpg))')

(...)是分组用的，被括起来的表达式用于分组。
(?:) 是(...)的不分组版本，用于使用'|'或数量词
所以分组的应该是http...jpg这个整体。

patten = r'(?<=srcset=\\")(http.+?(?:.jpeg|.jpg))'

撰写回答

推荐问题

相似问题

找不到问题？创建新问题