String byte[]中相互转化的字符集乱码问题

clipboard.png

 private static FileInputStream fr;
 fr = new FileInputStream("E://test-1.txt");
byte[] initContent = new byte[1024];
int size =  fr.read(initContent);
byte[] content = Arrays.copyOf(initContent, size);
String srcString = new String(initContent,"utf-8");
System.out.println("Original string:" + srcString);
输出为
Original string:Wish you success��

Why there are two �?

阅读 10.3k
1 个回答

试验了一下,叹号是全角的的时候,.txt 文件按 GBK 编码保存。
这种情况下读出来按 UTF8 生成字符串就是两个问号。
你改成 GBK 应该就对了。

如果你的文本文件用 UTF8 保存,然后读出来按 GBK 生成字符串,一样会乱码,你可以试试。

还有这里

String srcString = new String(initContent, "utf-8");

你是想写这个吧……

String srcString = new String(content, "utf-8");

要不然 content 完全没用。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进