请求地址url是通过firefox查看得到的json的地址,用浏览器可以打开,但是用scrapy爬的时候就被ban了求解决办法。
https://image.baidu.com/searc...
在 settings.py 将 ROBOTSTXT_OBEY = False 试试。
settings.py
ROBOTSTXT_OBEY = False
不要加hearders试试
赞成楼上,如果还会被墙。可采用scrapy+selenium+phantomjs的方式。
4 回答4.4k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
3 回答2.1k 阅读✓ 已解决
1 回答4.4k 阅读✓ 已解决
1 回答3.8k 阅读✓ 已解决
1 回答2.8k 阅读✓ 已解决
2 回答2k 阅读✓ 已解决
1.7k 阅读
2 回答6.2k 阅读✓ 已解决
1 回答3.2k 阅读✓ 已解决
2 回答3.9k 阅读✓ 已解决
1.1k 阅读
在
settings.py
将ROBOTSTXT_OBEY = False
试试。