Scrapy如何使用xpath提取包含em的所有文字

Question

如题，标签中包含em，i等其他标签，但需求是提取所有问题，请问有什么好的处理方法？或者说怎么能过滤掉这些标签。

示例：

<a><em>segmentfault</em>的一个标签</a>

需要提取的是：segmentfault的一个标签，但使用a/text()只能提取出的一个标签。

阅读 9.9k

1 个回答

得票最新

已经找到了答案，方法如下：
response = response.replace(body=response.body.replace('<em>', ''))

撰写回答

推荐问题

相似问题

找不到问题？创建新问题