Python：使用Scrapy框架的Imagepipeline组件如何下载gif呢?

Question

Python：使用Scrapy框架的Imagepipeline组件如何下载gif呢?

07未

722339697

发布于
2014-02-22

更新于
2014-02-22

默认情况下，使用Scrapy的ImagePipeline组件下载图片的时候，不论之前的图片格式是png还是gif，都会被保存成jpeg格式。
通过重写file_path方法，可以将图片以原来的格式和原图片名称进行保存。

重写file_path方法

__author__ = 'Fly'  
#coding:utf-8  
from scrapy.contrib.pipeline.images import ImagesPipeline  
from scrapy.http import Request  
from scrapy.exceptions import DropItem  

class MyImagesPipeline(ImagesPipeline):  
    def file_path(self, request, response=None, info=None):  
        image_guid = request.url.split('/')[-1]  
        return 'full/%s' % (image_guid)  

    def get_media_requests(self, item, info):  
        for image_url in item['image_urls']:  
            yield Request(image_url)  

    def item_completed(self, results, item, info):  
        image_paths = [x['path'] for ok, x in results if ok]  
        if not image_paths:  
            raise DropItem("Item contains no images")  
        return item

运行结果

图片URL：http://www.baidu.com/1.gif
保存到本地：1.gif
但是，当打开1.gif的时候，发现原本动态的图片现在却变成静态的了。
请问，有谁知道怎么处理吗？

python scrapy

阅读 8.5k

1 个回答

得票最新

reverland

112147

发布于
2014-02-22

试着覆盖convertimage

https://github.com/scrapy/scrapy/blob/master/scrapy/contrib/pipeline/images.py#L87

__author__ = 'Fly'  
#coding:utf-8  
from scrapy.contrib.pipeline.images import ImagesPipeline  
from scrapy.http import Request  
from scrapy.exceptions import DropItem  

class MyImagesPipeline(ImagesPipeline):  
    def file_path(self, request, response=None, info=None):  
        image_guid = request.url.split('/')[-1]  
        return 'full/%s' % (image_guid)  

    def get_media_requests(self, item, info):  
        for image_url in item['image_urls']:  
            yield Request(image_url)  

    def item_completed(self, results, item, info):  
        image_paths = [x['path'] for ok, x in results if ok]  
        if not image_paths:  
            raise DropItem("Item contains no images")  
        return item

    def convert_image(self, image, size=None): 
        buf = StringIO()
        image.save(buf)
        return image, buf

试试，可能会出错，文档上说这个pipeline会：

Convert all downloaded images to a common format (JPG) and mode (RGB)
Avoid re-downloading images which were downloaded recently
Thumbnail generation
Check images width/height to make sure they meet a minimum constraint

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

Python：使用Scrapy框架的Imagepipeline组件如何下载gif呢?

重写file_path方法

运行结果

你尚未登录，登录后可以

字节的 trae AI IDE 不支持类似 vscode 的 ssh remote 远程开发怎么办？

DataCap 中验证码无法显示，后台出现 NullPointerException 错误?

如何使用 python 代码实现迅雷磁力链接资源的下载？

如何实现一个深拷贝函数？

请问，FastAPI如何获取到前端上传的二进制文件并且返回？

浏览器能请求到数据怎么换了api工具或是爬虫都没数据了呢？

Python 成员变量在多个子类实例间共享，如何避免？