1使用PdfReaderContentParser 读取pdf文档 明明有文字内容(不是扫描版pdf) 但是只能读到位置信息 读到String信息都是空格,然后我用Word打开了一下这个pdf再转存为pdf 再读取新的pdf是能够读取到内容的,看了一下两个pdf的差别好像在版本号。 源文件是1.4,转存的是1.7。我猜想是版本的问题,但是我利用itext 生成一个新的pdf文档 也是1.4的版本是可以读取到内容的。现在我凌乱了 到底是pdf版本的问题 还是我的itext版本的问题? 怎样才能正确的读取内容呢?
首先感谢二位的回答,也接受你们关于提问的建议。同时我认为描述的够清楚了,是读取pdf内容能读到位置信息读不到String的值。原因也找到了 是因为没有添加 itextasian 的jar包所以没法解码 pdfstring 成string。再次感谢!