我正在尝试了解 beautifulsoup 的工作原理以创建应用程序。
我能够使用 .find_all() 查找并打印所有元素,但是它们也会打印 html 标签。我怎样才能只打印这些标签中的文本。
这就是我所拥有的:
from bs4 import BeautifulSoup
"""<html>
<p>1</p>
<p>2</p>
<p>3</p>
"""
soup = BeautifulSoup(open('index.html'), "html.parser")
i = soup.find_all('p')
print i
原文由 snovosel 发布,翻译遵循 CC BY-SA 4.0 许可协议
这可能对您有帮助:-
输出:-