python将pdf转换为图片，pdf中有图片

可以使用Python的PyPDF2库和Pillow库来将PDF文件中的每一页转换为图片，如果PDF中有图片，那么图片也会被转换为相应的图片格式。

以下是一个示例代码，需要安装PyPDF2和Pillow库：

import os
from io import BytesIO
import PyPDF2
from PIL import Image

def pdf_to_images(file_path, output_folder):
    # 打开PDF文件
    with open(file_path, 'rb') as file:
        reader = PyPDF2.PdfFileReader(file)
        # 遍历每一页
        for page_num in range(reader.getNumPages()):
            page = reader.getPage(page_num)
            # 将PDF页转换为Pillow Image对象
            img = page_to_image(page)
            # 保存图片到文件夹
            save_image(img, page_num, output_folder)

def page_to_image(page):
    # 获取PDF页的尺寸
    page_size = page.mediaBox
    # 创建空白的Pillow Image对象
    img = Image.new('RGB', (int(page_size.getWidth()), int(page_size.getHeight())), 'white')
    # 将PDF页渲染到Pillow Image对象中
    img_draw = ImageDraw.Draw(img)
    img_draw.rectangle((0, 0, img.size[0], img.size[1]), fill='white')
    img_draw_img = ImageDraw.Draw(img)
    img_draw_img.drawImage(page, (0, 0))
    return img

def save_image(img, page_num, output_folder):
    # 创建输出文件夹
    if not os.path.exists(output_folder):
        os.makedirs(output_folder, exist_ok=True)
    # 保存图片到输出文件夹
    file_path = os.path.join(output_folder, f'{page_num}.png')
    img.save(file_path)

# 使用示例
pdf_to_images('example.pdf', 'output_folder')

在上面的示例代码中，首先打开了PDF文件并遍历每一页，然后将每一页转换为Pillow Image对象。我们最终将Pillow Image对象保存为PNG格式的图片文件，并将它们保存在指定的输出文件夹中。

python将pdf转换为图片，pdf中有图片

mayaohua

引用和评论

新手必看：老域名+六步法，让你的网站权重飙升

Anaconda安装教程以及Anaconda和pip配置国内镜像

如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践

pip安装报错：No such file or directory 'conda-forge' 没有那个文件或目录

科学计算编程涉及到的技术栈简介

Python 描述符

使用 chardet 判断文件编码需要注意的坑——过大的文件会导致高耗时