0

关于正则表达式匹配问题

import re
import requests

def get(name):

baseurl =  "https://tieba.baidu.com/f?ie=utf-8&kw{}&fr=search".format(name)
content = requests.get(baseurl).text
print(content)
p2 = re.compile('<a href=".*?pn=(.*?)" class="last pagination-item ">尾页</a>')
num = p2.findall(content)
print(num)

get("鹿晗")

想要匹配尾页这一行的 href属性中的pn,但是上面的匹配出来为空值,请问错在什么地方?刚开始看正则表达式,谢谢指教

2个回答

0

0

先把name编译成url格式

撰写答案