1、爬一些代码要保持原来的<pre> 或者是节点的内容里有img标签,get_text()好像也会把其他东西去掉啊。。
1、爬一些代码要保持原来的<pre> 或者是节点的内容里有img标签,get_text()好像也会把其他东西去掉啊。。
from bs4 import BeautifulSoup
html = '''
<title>javascript - beautifulSoup4 怎么获取某个节点以内所有的html代码 - SegmentFault</title>
<meta name="description" content="1、爬一些代码要保持原来的&lt;pre&gt; 或者是节点的内容里有img标签,get_text()好像也会把其他东西去掉啊。。"/>
'''
soup = BeautifulSoup(html,'lxml')
print(soup.title.prettify())
13 回答13k 阅读
2 回答5.2k 阅读✓ 已解决
7 回答2.2k 阅读
2 回答1.2k 阅读✓ 已解决
4 回答1.5k 阅读✓ 已解决
3 回答1.4k 阅读✓ 已解决
6 回答1.3k 阅读✓ 已解决
楼主,给你推荐pyquery