QueryList 设置代理proxy参数不起作用?

新手上路,请多包涵

如题 QueryList 设置代理proxy参数 采集58网站依然提示“系统检测到您疑似使用网页抓取工具访问本网站”,哪位大神知道怎么处理,谢谢

阅读 1.8k
1 个回答

判断 proxy 参数是否有效的最简单办法就是乱填一个代理,比如 http://192.168.1.1:2666,如果不能访问,那就说明这个参数是有效的,如果能访问,大概率就是参数没效,不过 QueryList文档中已经表明了 proxy 是一个有效的参数。

爬虫被识别的原因有很多,比如网页使用 JavaScript 设置一个 Cookie,而 QueryList 这类工具是不会执行 JavaScript 代码的,进而就没有这个 Cookie,自然就可以识别到这是一个爬虫。

可以考虑使用一些无头浏览器,这些浏览器几乎就和正常访问网页一样,只是效率会更低,消耗的资源会更多。

而大部分无头浏览器是有特征的,也可能会被高等级的风控所识别。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题