Tabula 按区域坐标提取表格

新手上路,请多包涵

我们可以选择通过指定坐标从 PDF 文档中提取表格。对于 Windows 用户,为了获取坐标,您必须将 PDF 文件上传到 Tabula 网页并导出包含坐标的脚本,然后将坐标输入到您的代码中。对于 Mac 用户,您只需使用预览应用程序和裁剪检查器。我只是想知道是否有任何第三方程序或插件可以为 Windows 用户提供此功能?我认为这在以下情况下会很方便:

  1. 当您无法访问互联网时。
  2. 我认为预览应用程序会更准确,因为我遇到过从 Tabula 网页生成的坐标不准确的情况。

如果有人能指出我在哪里可以找到这样的东西,我将不胜感激。非常感谢。

原文由 Eric Choi 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 864
1 个回答

Tabula 需要以 PDF 单位指定区域,定义为 172 英寸。如果使用 Acrobat Reader DC,您可以使用测量工具并将其读数乘以 72。

Tabula 需要将区域指定为 topleftbottomright 距离。要获得它们,您可以测量从页面 顶部 到表格开头的距离等。

在此处输入图像描述

原文由 Manuel Aristarán 发布,翻译遵循 CC BY-SA 3.0 许可协议

推荐问题