需要爬取的网页需要登陆才可以获取,但是又对爬取ip有限制,所以我想要使用代理ip进行爬取;
但是我在request的session中使用proxy后无法爬取到有信息的网页,所以猜想可能是代理地址没有进行头部转发,这里想请教一下大家!
需要爬取的网页需要登陆才可以获取,但是又对爬取ip有限制,所以我想要使用代理ip进行爬取;
但是我在request的session中使用proxy后无法爬取到有信息的网页,所以猜想可能是代理地址没有进行头部转发,这里想请教一下大家!
4 回答4.5k 阅读✓ 已解决
1 回答3.4k 阅读✓ 已解决
4 回答3.9k 阅读✓ 已解决
3 回答2.2k 阅读✓ 已解决
1 回答4.5k 阅读✓ 已解决
2 回答465 阅读✓ 已解决
1 回答4k 阅读✓ 已解决
如果是从某个代理ip网站上抓取的ip,绝大部分是不可用的,可用的也因为超时等原因影响程序的稳定性,requests会自动帮你对HTTP头部的处理了,不存在你猜想的问题,应该是你代理ip的问题,看看我的使用代理ip
