java语言使用的是unicode？java“语言”本身不是纯英文吗？

swnuv

3.9k789661511

发布于
2016-04-23

1，Unicode占用2个字节，但是用java写的代码却可以保存为utf-8，占用汉字三个字节？
2，java语言本身是Unicode编码是什么意思？

java

阅读 4.3k

3 个回答

✓ 已被采纳

Java字符串在内存中以Unicode形式存在，再具体一点应该是UTF-16这种格式。而在源文件和编译文件中，字符串则可以以各种可支持的编码形式存在。简单的说，存在文件中的字符串是多种编码的，在它们被装载到内存时，都转换成了UTF-16的编码，所以说Java中字符串是统一编码的，这个统一是指在内存中统一。

另外，标准的Unicode占用的是4字节，并不是2字节，Java采用的UTF-16是优化存储后的Unicode，UTF-16对于常规字（包括全世界各种语言的文字）都可以以2字节存储，当然也有一些不在常用字范围的东西（在Unicode字符平面中靠后的）需要用4字节来存储，比如Emoji表情符号等。

Arnie97

2k51935

发布于
2016-04-23

Unicode是一种字符集(charset)，不是编码(encoding)，谈不上有几个字节，只能说有多少个码位。

同一个码位有N多种不同表示方式，例如Windows记事本中的Unicode其实指Unicode的UTF-16 LE表示方式，Unicode (Big Endian)指UTF-16 BE表示方式。

twoyao

32713

发布于
2016-04-23

更新于
2016-04-23

英文也是unicode的一部分java关键字是英文，但是其他可以不是。比如

public class Main {

    public static String 获取字符串() {
        return "你好，中国";
    }

    public static void main(String[] args) throws InterruptedException {
        System.out.println(获取字符串());
    }
}

javac 编译中有参数可以制定源代码的编码 -encoding <encoding> Specify character encoding used by source files 所以源码用其他编码都是可以的，最常见的是使用UTF-8.

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

java语言使用的是unicode？java“语言”本身不是纯英文吗？

你尚未登录，登录后可以

Spring中的两个疑惑?

求java/php大佬帮帮忙？

Java实例变量默认值赋值时机是什么时候？

java连redis-sentinel连不上,接下来如何排查?

请问，低代码中，DSL和DSL2CODE是否有公共语言的实现呢？

阿里的EasyExcel报错， Can not close IO.] with root cause java.io.IOException: Broken pipe？

Spring 2 到 Spring 3 迁移后 Redis 报错 NOAUTH 错误的原因及解决？