scrapy爬取, 遇到重定向?如何破?

爬取链接: self.start_urls = ["https://www.nature.com/nchem/research/index.html"]

提示:

DEBUG: Redirecting (302) to <GET https://idp.nature.com/authorize?response_type=cookie&client_id=foxtrot&redirect_uri=http%3A%2F%2Fwww.nature.com%2Fnchem%2Fresearch%2Findex.html%3Ffoxtrotcallback%3Dtrue> from <GET https://www.nature.com/nchem/research/index.html>

ps:我直接爬https://idp.nature.com/author...又重定向到原来地址

这个问题能解决吗?请教各位!

阅读 11.1k
2 个回答
新手上路,请多包涵

eg:
import requests
r = requests.get('http://github.com',allow_redirects=False)

allow_redirects=False#设置这个属性为False则是不允许重定向,反之可以重定向

设置user-agent试试。
还有是对方检测到请求里没有cookie之类的东东,就302到专门设置cookie的地址,设置完后,又会跳转回去。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进