从标准pdf文档中获取表格数据

有一个pdf文档，文档里面有一些表格，我现在想从这个pdf文档中将表格数据提取出来，保存成一个xml格式。
我现在使用了xpdf这个开源库，也转换成xml或者html格式，不过我不能根据生成的xml或者html判断出那些数据是之前pdf文档中的表格数据。所以还是不能获取到想要的数据，请问有什么比较好的方法获取这些表格数据吗，mupdf这个开源库可以吗？

阅读 3.9k

从标准pdf文档中获取表格数据

你尚未登录，登录后可以

问一个鼠标滚动事件，这种是怎么实现的？

form对象根据表单dom元素的name属性获取元素对象是基于什么标准的？兼容性如何？

我想使用命令行指令批量从md文件生成pdf文件,该怎么做?

threejs用octree实现房间内第三人称漫游并且添加了碰撞，人物在碰撞到墙壁的时候不停的弹回，应该怎么修改才能不会疯狂的弹回？

Vue为什么说textarea标签不支持插值表达式的？

为什么下面的代码内部的 div 其 100% 高度可以跳过上层元素?

单页应用网站缓存不是由于index.html文件被缓存导致的吗？