我有一个页面需要获取与 BS4 一起使用的源代码,但是页面中间需要 1 秒(可能更少)来加载内容,并且 requests.get 在加载该部分之前捕获页面的源代码,如何我可以等一下再获取数据吗?
r = requests.get(URL + self.search, headers=USER_AGENT, timeout=5 )
soup = BeautifulSoup(r.content, 'html.parser')
a = soup.find_all('section', 'wrapper')
<section class="wrapper" id="resultado_busca">
原文由 ribas 发布,翻译遵循 CC BY-SA 4.0 许可协议
看起来不是等待的问题,看起来元素是由JavaScript创建的,
requests
无法处理JavaScript动态生成的元素。一个建议是使用selenium
和PhantomJS
来获取页面源代码,然后你可以使用BeautifulSoup
下面显示的代码正是你的pars :此外,如果您只查找一个元素,则无需使用
.findAll
。