python爬虫如何获取动态的table内容？浏览器显示点击无get和其他网络请求

Question

python爬虫如何获取动态的table内容？浏览器显示点击无get和其他网络请求

two_dog

51512

发布于
2018-11-18

我想爬取下面这个网站的ip列表
https://free-proxy-list.net/

因为每一页都会更新ip，所以需要翻页，一开始用selenium做，可以弄，可是觉得成本太大。所以想用requests弄。

点击了那个 next 按钮控件，在浏览器的监视器的network里，发现没有JavaScript执行。也没有数据被传输。看了下那些控件，比如那个first

<li class="fg-button ui-button ui-state-default first" id="proxylisttable_first"><a href="#" aria-controls="proxylisttable" data-dt-idx="0" tabindex="0">First</a></li>

感觉好像是通过aria-controls来更新table的，可是我查了下，完全没有头绪。如果没有从服务器get数据，那么数据应该是保存在哪里了？搜了下html文件，发现似乎也没有其他页面的ip数据。

网页爬虫

python html

阅读 3.7k

1 个回答

得票最新

JamCh01

3448

发布于
2018-11-19

✓ 已被采纳

不如看看源码？所有的内容都在源码中~

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

python爬虫如何获取动态的table内容？浏览器显示点击无get和其他网络请求

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

问一个鼠标滚动事件，这种是怎么实现的？

form对象根据表单dom元素的name属性获取元素对象是基于什么标准的？兼容性如何？