2 个回答

降低你的爬去频率,或者使用多IP 代理。

如果验证码比较复杂的话,可以使用各种打码平台提供的验证码识别API(可能收费)。
比较简单的可以使用pytesseract库进行识别(可参考https://www.waitalone.cn/pyth...)。
主要思路就是将验证码下载下来,注意保存cookie或session,然后识别验证码,提交结果带上相关cookie或session。
想要减少验证的次数可以试着更换代理IP,设置爬虫间隔,更换User-Agent等操作。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题