如题,标签中包含em,i等其他标签,但需求是提取所有问题,请问有什么好的处理方法?或者说怎么能过滤掉这些标签。
示例:
<a><em>segmentfault</em>的一个标签</a>
需要提取的是:segmentfault的一个标签
,但使用a/text()
只能提取出的一个标签
。
如题,标签中包含em,i等其他标签,但需求是提取所有问题,请问有什么好的处理方法?或者说怎么能过滤掉这些标签。
示例:
<a><em>segmentfault</em>的一个标签</a>
需要提取的是:segmentfault的一个标签
,但使用a/text()
只能提取出的一个标签
。
已经找到了答案,方法如下:
response = response.replace(body=response.body.replace('<em>', ''))