如何在目录/子目录中搜索 PDF 文件的内容?我正在寻找一些命令行工具。似乎 grep
无法搜索PDF文件。
原文由 Jestin Joy 发布,翻译遵循 CC BY-SA 4.0 许可协议
如何在目录/子目录中搜索 PDF 文件的内容?我正在寻找一些命令行工具。似乎 grep
无法搜索PDF文件。
原文由 Jestin Joy 发布,翻译遵循 CC BY-SA 4.0 许可协议
有 pdfgrep ,它的功能正是它的名字所暗示的。
pdfgrep -R 'a pattern to search recursively from path' /some/path
我已经将它用于简单的搜索,并且效果很好。
(在 Debian、Ubuntu 和 Fedora 中有软件包。)
从 1.3.0 版 开始,pdfgrep 支持递归搜索。自 Ubuntu 12.10 (Quantal) 起,该版本在 Ubuntu 中可用。
原文由 Graeme 发布,翻译遵循 CC BY-SA 4.0 许可协议
7 回答5.3k 阅读
4 回答4k 阅读
2 回答5.9k 阅读✓ 已解决
2 回答2.5k 阅读✓ 已解决
1 回答2.3k 阅读✓ 已解决
2 回答799 阅读✓ 已解决
2 回答3.2k 阅读
您的发行版应提供一个名为
pdftotext
的实用程序:“-”对于将 pdftotext 输出到标准输出而不是文件是必需的。
--with-filename
和--label=
选项会将文件名放在 grep 的输出中。可选的--color
标志很好,它告诉 grep 在终端上使用颜色输出。(在 Ubuntu 中,
pdftotext
由xpdf-utils
或poppler-utils
包提供。)This method, using
pdftotext
andgrep
, has an advantage overpdfgrep
if you want to use features of GNUgrep
thatpdfgrep
不支持。 注意:pdfgrep-1.3.x 支持-C
打印上下文行的选项。