爬虫中遇到java.net.SocketException该如何解决?

爬虫本身没问题,今天突然报错,使用webmagic,jsoup和httpclient都出现同样的错误,设置了cookie,userAgent,host和间隔时间都没用,但浏览器可以正常访问该网页,猜测是反爬虫机制,网上搜了下没有合适的解决方案,求大神讲下原理及如何解决。

clipboard.png

阅读 3.5k
1 个回答

用htmlunit、phantomjs、selenium试试,注意设置User-Agent

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题