从标准pdf文档中获取表格数据

有一个pdf文档,文档里面有一些表格,我现在想从这个pdf文档中将表格数据提取出来,保存成一个xml格式。
我现在使用了xpdf这个开源库,也转换成xml或者html格式,不过我不能根据生成的xml或者html判断出那些数据是之前pdf文档中的表格数据。所以还是不能获取到想要的数据,请问有什么比较好的方法获取这些表格数据吗,mupdf这个开源库可以吗?

阅读 3.8k
1 个回答
新手上路,请多包涵

楼主后来有解决吗?

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题