iText 5 使用PdfReaderContentParser 读取pdf内容为空格

发布于
2017-11-23

1使用PdfReaderContentParser 读取pdf文档明明有文字内容（不是扫描版pdf）但是只能读到位置信息读到String信息都是空格，然后我用Word打开了一下这个pdf再转存为pdf 再读取新的pdf是能够读取到内容的，看了一下两个pdf的差别好像在版本号。源文件是1.4，转存的是1.7。我猜想是版本的问题，但是我利用itext 生成一个新的pdf文档也是1.4的版本是可以读取到内容的。现在我凌乱了到底是pdf版本的问题还是我的itext版本的问题？怎样才能正确的读取内容呢？

阅读 7.4k

5 个回答

发布于
2017-11-24

✓ 已被采纳

首先感谢二位的回答，也接受你们关于提问的建议。同时我认为描述的够清楚了，是读取pdf内容能读到位置信息读不到String的值。原因也找到了是因为没有添加 itextasian 的jar包所以没法解码 pdfstring 成string。再次感谢！

发布于
2017-11-24

读不出来的内容是form吗？有可能是read only的。问问题的时候最好说详细点，不要让人猜。起码要贴code。如果不需要保密，最好有pdf文件。

峰峰峰峰峰

发布于
2017-11-24

这种脑补原因的无法回答

发布于
2021-07-15

建议可以试试Free Spire.PDF for Java第三方免费控件来读取PDF文档内容，相关代码示例可参考官网教程。https://www.e-iceblue.cn/pdf_...
产品包下载链接：https://www.e-iceblue.cn/Down...

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题