python爬虫如何把<a>标签里面的<span>标签内容删去,不抓取<span>里面的文档

clipboard.png
我只想获取降临而不是<span>里面的文字,怎么办

name=link.select('a')[0].text.replace(' ','')
这是我的代码

阅读 10k
2 个回答

直接用正则吧,

import re
match = re.search('>"(.*?)"<span>', a标签的html内容)
print(match.group(1)

可以用Beautifulsoup

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进