beautifulSoup4 怎么获取某个节点以内所有的html代码

1、爬一些代码要保持原来的<pre> 或者是节点的内容里有img标签,get_text()好像也会把其他东西去掉啊。。

阅读 4.5k
2 个回答

楼主,给你推荐pyquery

from bs4 import BeautifulSoup

html = '''
<title>javascript - beautifulSoup4 怎么获取某个节点以内所有的html代码 - SegmentFault</title>
<meta name="description" content="1、爬一些代码要保持原来的&amp;lt;pre&amp;gt; 或者是节点的内容里有img标签,get_text()好像也会把其他东西去掉啊。。"/>
'''

soup = BeautifulSoup(html,'lxml')
print(soup.title.prettify())
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题