有一个pdf文档,文档里面有一些表格,我现在想从这个pdf文档中将表格数据提取出来,保存成一个xml格式。
我现在使用了xpdf这个开源库,也转换成xml或者html格式,不过我不能根据生成的xml或者html判断出那些数据是之前pdf文档中的表格数据。所以还是不能获取到想要的数据,请问有什么比较好的方法获取这些表格数据吗,mupdf这个开源库可以吗?
有一个pdf文档,文档里面有一些表格,我现在想从这个pdf文档中将表格数据提取出来,保存成一个xml格式。
我现在使用了xpdf这个开源库,也转换成xml或者html格式,不过我不能根据生成的xml或者html判断出那些数据是之前pdf文档中的表格数据。所以还是不能获取到想要的数据,请问有什么比较好的方法获取这些表格数据吗,mupdf这个开源库可以吗?
4 回答2.2k 阅读
3 回答2.1k 阅读
2 回答991 阅读✓ 已解决
4 回答948 阅读
2 回答1.9k 阅读
2.6k 阅读
1 回答701 阅读✓ 已解决
楼主后来有解决吗?