如何用正则匹配指定数字开头的指定长度的所有数据?(包含数字本身)

例如不重复地提取本页所有131开头的7位数字

<a href="/1310280" title="1310280">1310280</a></li><li><a href="/1310281" title="1310281">1310281</a></li><li><a href="/1310282" title="1310282">1310282</a></li><li><a href="/1310283" title="1310283">1310283</a></li><li><a href="/1310284" title="1310284">1310284</a></li><li><a href="/1310285" title="1310285">1310285</a></li><li><a href="/1310286" title="1310286">1310286</a></li><li><a href="/1310287" title="1310287">1310287</a></li><li><a href="/1310288" title="1310288">1310288</a>
回复
阅读 6.5k
2 个回答

郁闷,自己解决了

re.compile(r'%s+?\d{4}(?=">)'%(前缀))

import re
re.findall(r"131\d{4}","匹配的字符串")
返回值是数组,过滤一下相同数据就可以了。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏