Scrapy要用代理ip，有自带的中间件可以使用吗？

mypoly

1.8k91492544

发布于
2016-07-24

Scrapy要用代理ip，有自带的中间件可以使用吗？
如果有的话，怎么使用？有文章或文档什么的麻烦贴一下链接，谢谢！

scrapy python3.5

阅读 10.9k

2 个回答

将以下代码保存为 middlewares.py 放项目目录里

import random, base64

class ProxyMiddleware(object):

    proxyList = ['36.250.69.4:80', '58.18.52.168:3128', '58.253.238.243:80', '60.191.164.22:3128', '60.191.167.93:3128']
    
    def process_request(self, request, spider):
        # Set the location of the proxy
        pro_adr = random.choice(self.proxyList)
        print "USE PROXY -> "+pro_adr
        request.meta['proxy'] = "http://"+ pro_adr
        
'''这里用的免费代理,不用用户名密码的.如果有用户名和密码,还要加入以下代码
proxy_user_pass = "USERNAME:PASSWORD"
encoded_user_pass = base64.encodestring(proxy_user_pass)
request.headers['Proxy-Authorization'] = 'Basic ' + encoded_user_pass'''

在setting.py文件里加入以下代码:

DOWNLOADER_MIDDLEWARES = {
    #项目名称改成自己的
    'pro_name.middlewares.ProxyMiddleware': 100,
    'scrapy.contrib.downloadermiddleware.httpproxy.HttpProxyMiddleware': 110
}

haofly

1.1k61320

发布于
2016-07-24

这个应该是你想要的http://doc.scrapy.org/en/mast...

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

python发送can消息无效果?
查询文档后编写代码如下 {代码...} 运行之后提示发送成功，但是实际上我在canalyzer面板上并没有看到消息的信号值发生变化，请问这里该怎么做才能是真的发送成功？
938 阅读

相似问题

找不到问题？创建新问题

Scrapy要用代理ip，有自带的中间件可以使用吗？

你尚未登录，登录后可以

python发送can消息无效果?