1、爬一些代码要保持原来的<pre> 或者是节点的内容里有img标签,get_text()好像也会把其他东西去掉啊。。
1、爬一些代码要保持原来的<pre> 或者是节点的内容里有img标签,get_text()好像也会把其他东西去掉啊。。
from bs4 import BeautifulSoup
html = '''
<title>javascript - beautifulSoup4 怎么获取某个节点以内所有的html代码 - SegmentFault</title>
<meta name="description" content="1、爬一些代码要保持原来的&lt;pre&gt; 或者是节点的内容里有img标签,get_text()好像也会把其他东西去掉啊。。"/>
'''
soup = BeautifulSoup(html,'lxml')
print(soup.title.prettify())
10 回答11.2k 阅读
5 回答4.9k 阅读✓ 已解决
4 回答3.1k 阅读✓ 已解决
2 回答2.8k 阅读✓ 已解决
4 回答4.5k 阅读✓ 已解决
1 回答3.2k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
楼主,给你推荐pyquery