我们可以选择通过指定坐标从 PDF 文档中提取表格。对于 Windows 用户,为了获取坐标,您必须将 PDF 文件上传到 Tabula 网页并导出包含坐标的脚本,然后将坐标输入到您的代码中。对于 Mac 用户,您只需使用预览应用程序和裁剪检查器。我只是想知道是否有任何第三方程序或插件可以为 Windows 用户提供此功能?我认为这在以下情况下会很方便:
- 当您无法访问互联网时。
- 我认为预览应用程序会更准确,因为我遇到过从 Tabula 网页生成的坐标不准确的情况。
如果有人能指出我在哪里可以找到这样的东西,我将不胜感激。非常感谢。
原文由 Eric Choi 发布,翻译遵循 CC BY-SA 4.0 许可协议
Tabula 需要以 PDF 单位指定区域,定义为 1⁄72 英寸。如果使用 Acrobat Reader DC,您可以使用测量工具并将其读数乘以 72。
Tabula 需要将区域指定为 top 、 left 、 bottom 和 right 距离。要获得它们,您可以测量从页面 顶部 到表格开头的距离等。