Scrapy如何使用xpath提取包含em的所有文字

如题,标签中包含em,i等其他标签,但需求是提取所有问题,请问有什么好的处理方法?或者说怎么能过滤掉这些标签。

示例:

<a><em>segmentfault</em>的一个标签</a>

需要提取的是:segmentfault的一个标签,但使用a/text()只能提取出的一个标签

阅读 9.8k
1 个回答

已经找到了答案,方法如下:
response = response.replace(body=response.body.replace('<em>', ''))

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进