iText 5 使用PdfReaderContentParser 读取pdf内容为空格

1使用PdfReaderContentParser 读取pdf文档 明明有文字内容(不是扫描版pdf) 但是只能读到位置信息 读到String信息都是空格,然后我用Word打开了一下这个pdf再转存为pdf 再读取新的pdf是能够读取到内容的,看了一下两个pdf的差别好像在版本号。 源文件是1.4,转存的是1.7。我猜想是版本的问题,但是我利用itext 生成一个新的pdf文档 也是1.4的版本是可以读取到内容的。现在我凌乱了 到底是pdf版本的问题 还是我的itext版本的问题? 怎样才能正确的读取内容呢?

阅读 7.3k
5 个回答

首先感谢二位的回答,也接受你们关于提问的建议。同时我认为描述的够清楚了,是读取pdf内容能读到位置信息读不到String的值。原因也找到了 是因为没有添加 itextasian 的jar包所以没法解码 pdfstring 成string。再次感谢!

读不出来的内容是form吗?有可能是read only的。问问题的时候最好说详细点,不要让人猜。起码要贴code。如果不需要保密,最好有pdf文件。

这种脑补原因的无法回答

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题