scrapy爬取，遇到重定向？如何破？

发布于
2017-08-02

爬取链接： self.start_urls = ["https://www.nature.com/nchem/research/index.html"]

提示：

DEBUG: Redirecting (302) to <GET https://idp.nature.com/authorize?response_type=cookie&client_id=foxtrot&redirect_uri=http%3A%2F%2Fwww.nature.com%2Fnchem%2Fresearch%2Findex.html%3Ffoxtrotcallback%3Dtrue> from <GET https://www.nature.com/nchem/research/index.html>

ps:我直接爬https://idp.nature.com/author...又重定向到原来地址

这个问题能解决吗？请教各位！

scrapy 网页爬虫重定向爬虫图片

阅读 11.3k

2 个回答

pyhton小白

发布于
2017-08-31

新手上路，请多包涵

eg:
import requests
r = requests.get('http://github.com',allow_redirects=False)

allow_redirects=False#设置这个属性为False则是不允许重定向，反之可以重定向

发布于
2017-09-05

设置user-agent试试。
还有是对方检测到请求里没有cookie之类的东东，就302到专门设置cookie的地址，设置完后，又会跳转回去。

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题