用 Java 读取 PDF 遇到中文标签该怎么处理

我使用 iText 去读取 PDF 内的信息，使用如下方法可以将有标签的 PDF 转换成 xml，可是遇到中文标签（不是正文中出现中文）的时候会出现乱码

TaggedPdfReaderTool readertool = new TaggedPdfReaderTool();
PdfReader reader = new PdfReader(pdfPath);
readertool.convertToXml(reader, new FileOutputStream(xmlPath));
reader.close();

出现的内容类似于

<？？-？？-？？>标题</??-??-??>

正确的应该是

<标题>标题</标题>

有什么方法可以处理掉这些乱码内容

java pdf

阅读 4k

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

Java 开发 URL 匹配问题？
所有url都是对应 spring boot 3.5.0 @PostMapping访问前先进拦截器，查看有没有访问权限，获取请求url，然后根据url去查是否有匹配的，现在静态的1,3,7直接查询是否相等就可以了，对于动态2,4,5,6怎么匹配？
4 回答1.8k 阅读✓ 已解决
诺依框架自动生成代码前端Vue3提交数据，后端Java没收到问题出在哪里？
使用诺依框架自动生成代码功能。前端在请求地址处打印提交数据（有数据）如下图，后端Debug模式，进入断点查看数据如下图所示（无数据），问题一般出在哪里？========== Payload ===========
4 回答1.5k 阅读✓ 已解决
WSL里的Ubuntu系统开发Spring Boot报错Project build error: Non-readable POM ？
在wsl装了Ubuntu20,clone了以前的Java项目，但是用Vscode打开项目报错,请问这是哪个环节出现了问题，以前clone下来直接跑，在win10环境也是正常启动的，请问是mvn环境的配置问题，还是WSL的环境配置问题？
1 回答2.7k 阅读✓ 已解决
spring boot 报错怎么解决：Invalid bean definition with name 'appMapper' defined in file ？
spring boot 报错怎么解决？org.springframework.beans.factory.BeanDefinitionStoreException: Invalid bean definition with name 'appMapper' defined in file ？
3 回答1.4k 阅读✓ 已解决
MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？
MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？不同敏感字段需要使用不同的密钥，加密取出后给前端需要做脱敏，脱敏是在 Jackson 序列化到前端的时候做吗？
4 回答2.4k 阅读
我想使用命令行指令批量从md文件生成pdf文件,该怎么做?
就像make指令一样,检查一下当前目录的所有md文件和对应pdf的最后修改日期,如果需要就更新...但,我现在从md文件到pdf文件的输出使用的是从typora软件的界面上手动转换.要想像我想的那样工作就必须能从命令行转换.我试了一下,类似这样的指令.
1 回答1.1k 阅读✓ 已解决
请问是否有什么方案实现不同用户之间本地数据库的同步呢？
请问是否有这样的功能？比如我本地A应用有应用sqlite数据库，然后用户B有同样的应用，C用户也有。A的数据库会自己增删改查，B/C的也会，但是有一天他们想要同步数据。请问是否有什么方案实现呢？
2 回答847 阅读✓ 已解决

相似问题

pdfbox往pdf填充内容再转成图片，内容里的中文丢失该怎么处理？
1 回答3k 阅读
使用 PDFBox 从 PDF 文档中读取特定页面
2 回答1.1k 阅读✓ 已解决
使用 Java 编辑 PDF 文本
2 回答1.1k 阅读✓ 已解决
java带格式的html转pdf
1 回答5.7k 阅读
如何使用Java阅读PDF文件？
2 回答757 阅读✓ 已解决

找不到问题？创建新问题

用 Java 读取 PDF 遇到中文标签该怎么处理

你尚未登录，登录后可以

Java 开发 URL 匹配问题？

诺依框架自动生成代码前端Vue3提交数据，后端Java没收到问题出在哪里？

WSL里的Ubuntu系统开发Spring Boot报错Project build error: Non-readable POM ？

spring boot 报错怎么解决：Invalid bean definition with name 'appMapper' defined in file ？

MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？

我想使用命令行指令批量从md文件生成pdf文件,该怎么做?

请问是否有什么方案实现不同用户之间本地数据库的同步呢？