我正在使用 beautifulsoup 从页面获取所有链接。我的代码是:
import requests
from bs4 import BeautifulSoup
url = 'http://www.acontecaeventos.com.br/marketing-promocional-sao-paulo'
r = requests.get(url)
html_content = r.text
soup = BeautifulSoup(html_content, 'lxml')
soup.find_all('href')
我得到的只是:
[]
如何获得该页面上所有 href 链接的列表?
原文由 user1922364 发布,翻译遵循 CC BY-SA 4.0 许可协议
您告诉
find_all
方法来查找href
标签, 而不是 属性。您需要找到
<a>
标签,它们用于表示链接元素。稍后您可以像这样访问它们的
href
属性: