如何使用 Python 读取存储在 PDF 文件中的属性/元数据,如标题、作者、主题和关键字?
原文由 Quicksilver 发布,翻译遵循 CC BY-SA 4.0 许可协议
如何使用 Python 读取存储在 PDF 文件中的属性/元数据,如标题、作者、主题和关键字?
原文由 Quicksilver 发布,翻译遵循 CC BY-SA 4.0 许可协议
对于 Python 3,请参阅 PyPDF2 ,其中来自 @Khaleel 的示例代码已更新为:
from PyPDF2 import PdfReader
reader = PdfReader("test.pdf")
pdf_info = reader.metadata
print(str(pdf_info))
使用 pip install PyPDF2
安装。
原文由 Morten Zilmer 发布,翻译遵循 CC BY-SA 4.0 许可协议
2 回答5.1k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答972 阅读✓ 已解决
3 回答1.1k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
1 回答1.2k 阅读✓ 已解决
试试 pdfminer :
这是输出:
有关详细信息,请查看本教程: 用于在 Python 中提取 PDF 元数据的轻量级 XMP 解析器。