python爬虫如何获取动态的table内容?浏览器显示点击无get和其他网络请求

我想爬取下面这个网站的ip列表
https://free-proxy-list.net/

因为每一页都会更新ip,所以需要翻页,一开始用selenium做,可以弄,可是觉得成本太大。所以想用requests弄。

点击了那个 next 按钮控件,在浏览器的监视器的network里,发现没有JavaScript执行。也没有数据被传输。看了下那些控件,比如那个first

<li class="fg-button ui-button ui-state-default first" id="proxylisttable_first"><a href="#" aria-controls="proxylisttable" data-dt-idx="0" tabindex="0">First</a></li>

感觉好像是通过aria-controls来更新table的,可是我查了下,完全没有头绪。如果没有从服务器get数据,那么数据应该是保存在哪里了?搜了下html文件,发现似乎也没有其他页面的ip数据。

阅读 3.6k
1 个回答

不如看看源码?所有的内容都在源码中~

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题