从标准pdf文档中获取表格数据

2014

发布于
2015-07-27

有一个pdf文档，文档里面有一些表格，我现在想从这个pdf文档中将表格数据提取出来，保存成一个xml格式。
我现在使用了xpdf这个开源库，也转换成xml或者html格式，不过我不能根据生成的xml或者html判断出那些数据是之前pdf文档中的表格数据。所以还是不能获取到想要的数据，请问有什么比较好的方法获取这些表格数据吗，mupdf这个开源库可以吗？

阅读 3.9k

1 个回答

发布于
2018-03-25

新手上路，请多包涵

楼主后来有解决吗？

查看全部 1 个回答

推荐问题

相似问题

找不到问题？创建新问题