我最开始是使用的pdfbox读取的只包含文字的pdf,通过网络上的教程是搞定了,可是现在要读的pdf上不止有文字,还有印章,直接读取会导致最后几排的文字无法正常获取(可能被章盖住了,识别不了吧),我应该如何做才能得到文字
先谢谢各位大佬了
我最开始是使用的pdfbox读取的只包含文字的pdf,通过网络上的教程是搞定了,可是现在要读的pdf上不止有文字,还有印章,直接读取会导致最后几排的文字无法正常获取(可能被章盖住了,识别不了吧),我应该如何做才能得到文字
先谢谢各位大佬了
15 回答8.1k 阅读
8 回答5.9k 阅读
1 回答4.1k 阅读✓ 已解决
3 回答2.2k 阅读✓ 已解决
2 回答3.1k 阅读
2 回答3.8k 阅读
1 回答2.1k 阅读✓ 已解决
可以试试Spire.PDF for Java控件,有免费版和商业版,除了操作文本上有限制区别外,均能够支持提取含有印章的PDF文档。以下代码可供参考。