在python代码中,如何高效地将pdf中的某个页面保存为jpeg文件? (用例:我有一个 python flask Web 服务器,其中将上传 pdf-s 并存储与每个页面对应的 jpeg-s。)
这个解决方案 很接近,但问题是它不会将整个页面转换为 jpeg。
原文由 vishvAs vAsuki 发布,翻译遵循 CC BY-SA 4.0 许可协议
在python代码中,如何高效地将pdf中的某个页面保存为jpeg文件? (用例:我有一个 python flask Web 服务器,其中将上传 pdf-s 并存储与每个页面对应的 jpeg-s。)
这个解决方案 很接近,但问题是它不会将整个页面转换为 jpeg。
原文由 vishvAs vAsuki 发布,翻译遵循 CC BY-SA 4.0 许可协议
我发现这个简单的解决方案 PyMuPDF 输出到 png 文件。请注意,该库被导入为“fitz”,这是它使用的渲染引擎的历史名称。
import fitz
pdffile = "infile.pdf"
doc = fitz.open(pdffile)
page = doc.load_page(0) # number of page
pix = page.get_pixmap()
output = "outfile.png"
pix.save(output)
注意:库从使用“camelCase”更改为“snake_cased”。如果您遇到函数不存在的错误,请查看 已弃用的名称。上面示例中的函数已相应更新。
原文由 JJPty 发布,翻译遵循 CC BY-SA 4.0 许可协议
2 回答5.1k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答1.4k 阅读✓ 已解决
3 回答1.3k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
1 回答1.2k 阅读✓ 已解决
可以使用 pdf2image 库。
您可以简单地使用安装它,
安装后,您可以使用以下代码获取图像。
以 jpeg 格式保存页面
编辑:Github repo pdf2image 还提到它使用
pdftoppm
并且它需要其他安装:您可以通过以下方式使用 anaconda 在 Windows 下安装最新版本:
注意:Windows 版本高达 0.67 可在 http://blog.alivate.com.au/poppler-windows/ 上获得,但请注意 0.68 于 2018 年 8 月发布, 因此您不会获得最新的功能或错误修复。