请求地址url是通过firefox查看得到的json的地址,用浏览器可以打开,但是用scrapy爬的时候就被ban了求解决办法。
https://image.baidu.com/searc...
在 settings.py 将 ROBOTSTXT_OBEY = False 试试。
settings.py
ROBOTSTXT_OBEY = False
不要加hearders试试
赞成楼上,如果还会被墙。可采用scrapy+selenium+phantomjs的方式。
2 回答5.1k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答1.4k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
1 回答1.2k 阅读✓ 已解决
1.7k 阅读
2 回答6.4k 阅读✓ 已解决
1 回答3.3k 阅读✓ 已解决
2 回答4k 阅读✓ 已解决
1.2k 阅读
在
settings.py
将ROBOTSTXT_OBEY = False
试试。