如何解决利用Jsoup解析网页偶然出现问号乱码的问题？

cfanr

70431120

发布于
2015-05-24

利用Jsoup解析网页文章，有时获取结果中部分文章的标题会出现问号乱码(???)的问题，试过指定编码解析，还是不能解决？

另外还有一个奇怪的地方，将含有乱码的字符串在android上的控件setText()，乱码会自动消失，恢复正常，谁有遇到过这种问题不？

java

android jsoup

阅读 8.2k

2 个回答

得票最新

cfanr

70431120

发布于
2015-05-24

✓ 已被采纳

采取Document document = Jsoup.parse(new URL(url).openStream(), "UTF-8", url);的方式获取，不要先获取网页html的文本，采用Jsoup.parse(html)的方式（即使在读html时设置了UTF-8，sb.append(new String(buf, 0, len, "UTF-8")); 这样也无效的）

Jsoup 采集回来的信息出现乱码
注：设置为UTF-8不是GBK

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

如何解决利用Jsoup解析网页偶然出现问号乱码的问题？

你尚未登录，登录后可以

Spring中的两个疑惑?

诺依框架自动生成代码前端Vue3提交数据，后端Java没收到问题出在哪里？

WSL里的Ubuntu系统开发Spring Boot报错Project build error: Non-readable POM ？

java开发发问URL匹配问题？

Spring Boot 3.2.2 连接 RocketMQ 5.1.2 报错如何解决？

微信小程序多端应用（安卓App）为何加载的还是旧的1.png图片？

有什么安卓自动化工具可以实现微信小程序的自动化签到？