“srcset=\"https://images/816057/photo-816057.jpeg?h=350&auto=compress&...
”
在很多类似代码中,我需要匹配出https://images/816057/photo-816057.jpeg
或是以jpg结尾的字符串。
我写的代码
patten = r'(?<=srcset=\\")http.+?(.jpeg|.jpg)'
res = re.findall(patten,str)
但是结果是['.jpeg', '.jpeg', '.jpeg', '.jpg'],请问下各位该怎么解决
(...)是分组用的,被括起来的表达式用于分组。
(?:) 是(...)的不分组版本,用于使用'|'或数量词
所以分组的应该是http...jpg这个整体。