问题描述
问题出现的环境背景及自己尝试过哪些方法
各位大哥,我在爬取豆瓣的时候遇到这样的重定向问题,如第一段代码所示;
在网上搜索过后,我在settings里面关掉了重定向,如第二段代码所示;
但是设置完成后,爬取文件时还是会有301的问题,我要爬取的数据全都爬不到,如第三段代码所示;
希望各位大佬能够帮忙!
相关代码
// 请把代码文本粘贴到下方(请勿用图片代替代码)
第一段代码:
2019-05-02 15:54:30 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://movie.douban.com/subj...; from <GET https://movie.douban.com/subj...;
2019-05-02 15:54:33 [scrapy.downloadermiddlewares.redirect] DEBUG: Redirecting (301) to <GET https://movie.douban.com/subj...; from <GET https://movie.douban.com/subj...;
第二段代码:
REDIRECT_ENABLED = False
HTTPERROR_ALLOWED_CODES = [301]
2019-05-02 15:53:58 [scrapy.core.engine] DEBUG: Crawled (301) <GET https://movie.douban.com/subj...; (referer: None)
{'comments': '',
'douban_id': '5908477',
'tags': '',
'types': '',
'vote_average': 'None',
'vote_count': 'None'}