lxml如何处理内容带html标签的元素?

新手上路,请多包涵

写爬虫的时候,遇到一个元素,其text里面是html格式:
image
获取这个元素的text_content(),lxml就傻了,出来一大堆东西:
image
它不能识别出这是内容文本,所以不知道应该停止。

请问这种情况应如何处理?谢谢。
遇到问题的页面在这里:
https://www.cnblogs.com/cate/...

阅读 839
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题