我试图找到一种方法来查看文件夹并搜索该文件夹中所有 powerpoint 文档的内容以查找特定字符串,最好使用 Python。找到这些字符串后,我想报告该字符串之后的文本以及找到它的文档。我想编译这些信息并将其报告为 CSV 文件。
到目前为止,我只遇到了 olefil 包, https: //bitbucket.org/decalage/olefileio_pl/wiki/Home。这提供了特定文档中包含的所有文本,这不是我想要做的。请帮忙。
原文由 kacey 发布,翻译遵循 CC BY-SA 4.0 许可协议
实际工作
如果要提取文本: