如何清理爬虫数据中一些不需要的 HTML 属性

比如对于以下数据

<p id="a">data</p>

我只想保留

<p>data</p>

该如何操作,有快捷的方法吗?

阅读 2.9k
1 个回答

思路:
1 获取当前element name,p
2 获取当前element text,data
3 组装成<element_name>text</element_name>

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题