考虑:
<div class="someClass">
<a href="href">
<img alt="some" src="some"/>
</a>
</div>
我想使用 Beautiful Soup 从图像(即 img )标签中提取源(即 src )属性。我使用 Beautiful Soup 4,我不能使用 a.attrs['src']
来获取 src
,但我可以获取 href
。我应该怎么办?
原文由 iDelusion 发布,翻译遵循 CC BY-SA 4.0 许可协议
您可以使用 Beautiful Soup 提取 HTML
img
标签的 src 属性。在我的示例中,htmlText
包含img
标签本身,但这也可以用于 URL,以及urllib2
对于网址
对于带有 img 标签的文本
蟒蛇 3:
如果需要安装模块