我想将多页 PDF 文档转换为列表结构中的一系列图像对象,而不用 Python 将图像保存在磁盘中(我想用 PIL Image 处理它们)。到目前为止,我只能先将图像写入文件:
from wand.image import Image
with Image(filename='source.pdf') as img:
with img.convert('png') as converted:
converted.save(filename='pyout/page.png')
但是我怎么能把上面的 img 对象直接变成 PIL.Image 对象列表呢?
原文由 Hendrik 发布,翻译遵循 CC BY-SA 4.0 许可协议
新答案:
pip 安装 pdf2image
您可能还需要安装枕头。这可能只适用于 linux。
https://github.com/Belval/pdf2image
两种方法的结果可能不同。
旧答案:
Python 3.4:
最后,您可以对 mogrify 进行系统调用,但这可能会更复杂,因为您需要管理临时文件。