lxml如何处理内容带html标签的元素？

发布于
2020-12-27

新手上路，请多包涵

写爬虫的时候，遇到一个元素，其text里面是html格式：

获取这个元素的text_content()，lxml就傻了，出来一大堆东西：

它不能识别出这是内容文本，所以不知道应该停止。

请问这种情况应如何处理？谢谢。
遇到问题的页面在这里：
https://www.cnblogs.com/cate/...

python lxml 网页爬虫

阅读 887

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题