利用Jsoup解析网页文章,有时获取结果中部分文章的标题会出现问号乱码(???)的问题,试过指定编码解析,还是不能解决?
另外还有一个奇怪的地方,将含有乱码的字符串在android上的控件setText(),乱码会自动消失,恢复正常,谁有遇到过这种问题不?
利用Jsoup解析网页文章,有时获取结果中部分文章的标题会出现问号乱码(???)的问题,试过指定编码解析,还是不能解决?
另外还有一个奇怪的地方,将含有乱码的字符串在android上的控件setText(),乱码会自动消失,恢复正常,谁有遇到过这种问题不?
15 回答8.3k 阅读
8 回答6.1k 阅读
1 回答4k 阅读✓ 已解决
3 回答5.9k 阅读
3 回答2.1k 阅读✓ 已解决
2 回答3.1k 阅读
2 回答3.8k 阅读
采取Document document = Jsoup.parse(new URL(url).openStream(), "UTF-8", url);的方式获取,不要先获取网页html的文本,采用Jsoup.parse(html)的方式(即使在读html时设置了UTF-8,sb.append(new String(buf, 0, len, "UTF-8")); 这样也无效的)
Jsoup 采集回来的信息出现乱码
注:设置为UTF-8不是GBK