中文乱码,所有编码格式都试过了,还是不行

我有一个从某一BI系统导出的csv格式的文件,英文数字正常显示,但中文都是乱码,用Word和Notepad++打开,把所有字符集都试过了,都不能正常显示,应该如何解决?

通过和网页上的报表对比,得知:
货号 显示为 »õºÅ 16进制:c2bb c3b5 c2ba c385
品名 显示为 Æ·Ãû 16进制:c386 c2b7 c383 c3bb

我知道怎么回事了,原始数据是GBK编码的,然后程序内使用了一个Windows1252转UTF-8的函数去转,于是就毁了……所以这边想问一下应该怎么转回来?

阅读 11.9k
1 个回答

你使用的是什么变成语言,提供一个java的解决方案
首先把字符串读取出来,然后getbyte使用Windows1252,再new string的时候设置编码,然后再输出出来。。。

    public static void main(String... args) throws UnsupportedEncodingException {
        String a = "»õºÅ ";
        String b = new String(a.getBytes("windows-1252"),"gbk");
        System.out.println(b);
    }

蛮蛋疼的。。。
介绍一个编码错误时推测的网站乱码恢复

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
宣传栏