scrapy 中异常处理的中间件如何调用

Question

scrapy 中异常处理的中间件如何调用

stephen2017

发布于
2018-12-27

更新于
2018-12-27

import time,random

from scrapy.downloadermiddlewares.retry import RetryMiddleware


class processallexceptionmiddleware(RetryMiddleware):


    def process_response(self, request, response, spider):
        # 捕获状态码为40x/50x的response
        if str(response.status).startswith('4') or str(response.status).startswith('5')or str(response.status).startswith('3'):
            print('报错的是4和5 3开头的重新请求')
            return request
        if 'forbidden' in response.url:
            return request
        return response



    def process_exception(self, request, exception, spider):
        # 捕获几乎所有的异常
        if isinstance(exception, self.EXCEPTIONS_TO_RETRY):
            print('打印异常')
            # 在日志中打印异常类型
            print('Got exception: %s' % (exception))
            # 随意封装一个response，返回给spider
            time.sleep(random.randint(3, 5))
            return request


 custom_settings = {
        "RANDOM_DELAY": 20,
        'DOWNLOADER_MIDDLEWARES': {
            'Espider.middlewares.proxymiddleware.proxy_middleware': 543,
            "Espider.middlewares.processallexceptionmiddleware.processallexceptionmiddleware": 544

        },

我这样处理后，没有调用，求人指教，谢谢我用了日志功能记录爬虫的行为

python

阅读 2.1k

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

scrapy 中异常处理的中间件如何调用

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

发现深拷贝和浅拷贝效果一致：请问一下有什么区别呢？

如何实现一个深拷贝函数？

Python 成员变量在多个子类实例间共享，如何避免？

为什么 Qwen2.5-Omni-7B 官方教程都报错 Cannot import available module of Qwen2_5OmniModel in modelscope ？

Spark-TTS-0.5B 的 requirements.txt 在哪里？