scrapy爬取带下划线域名出错

浏览器中能正常解析访问的link:

http://bsd_bj.b2b.huangye88.com/company_detail.html

scrapy执行出错的截图:

clipboard.png

requests执行成功的截图:

clipboard.png

请问有同学在使用scrapy爬取数据的时候遇到类似并成功解决的吗?类似的域名还有很多, 如:

chenran_groupca.b2b.huangye88.com
huawei_h3c_cisco.b2b.huangye88.com
yuzhenhua841104_.b2b.huangye88.com
阅读 2.7k
1 个回答

怎么处理的呢。。。。哈哈哈哈哈哈哈哈 2017 年的东西了

image.png

可以修改 idna 包的 core.py 文件。
域名校验不让抛异常,正常走。 哈哈哈哈哈!(2019.11.06)

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题