可以使用 BeautifulSoup 从 HTML 中删除 <script>
标签及其所有内容,还是我必须使用正则表达式或其他东西?
原文由 Sam 发布,翻译遵循 CC BY-SA 4.0 许可协议
可以使用 BeautifulSoup 从 HTML 中删除 <script>
标签及其所有内容,还是我必须使用正则表达式或其他东西?
原文由 Sam 发布,翻译遵循 CC BY-SA 4.0 许可协议
为将来可能需要参考的人更新的答案:正确答案是。 decompose()
。您可以使用不同的方式,但 decompose
可以正常工作。
用法示例:
soup = BeautifulSoup('<p>This is a slimy text and <i> I am slimer</i></p>')
soup.i.decompose()
print str(soup)
#prints '<p>This is a slimy text and</p>'
对于摆脱像 <script>
, <img>
等碎屑非常有用。
原文由 Abhishek Dujari 发布,翻译遵循 CC BY-SA 4.0 许可协议
2 回答5.2k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答1.4k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
2 回答1.5k 阅读✓ 已解决
2 回答893 阅读✓ 已解决