请问在scrapy爬取豆瓣电影时遇到301重定向问题如何解决?

新手上路,请多包涵

问题描述

问题出现的环境背景及自己尝试过哪些方法

各位大哥,我在爬取豆瓣的时候遇到这样的重定向问题,如第一段代码所示;
在网上搜索过后,我在settings里面关掉了重定向,如第二段代码所示;
但是设置完成后,爬取文件时还是会有301的问题,我要爬取的数据全都爬不到,如第三段代码所示;
希望各位大佬能够帮忙!

相关代码

// 请把代码文本粘贴到下方(请勿用图片代替代码)
第一段代码:
2019-05-02 15:54:30 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://movie.douban.com/subj...; from <GET https://movie.douban.com/subj...;
2019-05-02 15:54:33 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://movie.douban.com/subj...; from <GET https://movie.douban.com/subj...;

第二段代码:
REDIRECT_ENABLED = False
HTTPERROR_ALLOWED_CODES = [301]

2019-05-02 15:53:58 [scrapy.core.engine] DEBUG: Crawled (301) <GET https://movie.douban.com/subj...; (referer: None)
{'comments': '',
'douban_id': '5908477',
'tags': '',
'types': '',
'vote_average': 'None',
'vote_count': 'None'}

你期待的结果是什么?实际看到的错误信息又是什么?

阅读 3.8k
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题