Java的char型变量中能不能存贮一个中文汉字?为什么?
不能, 因为历史原因, java char被定义为 两个字节. 而 表示 unicode 用两个字节是不够的. 表示所有的汉字 需要 两个char.
supplementary characters are defined by a pair of code point values that are called surrogates. The first code point is from the high surrogates range of U+D800 to U+DFBB, and the second code point is from the low surrogates range of U+DC00 to U+DFFF.
https://docs.oracle.com/javase/tutorial/...
https://docs.oracle.com/javase/tutorial/...
4 回答1.5k 阅读✓ 已解决
4 回答1.3k 阅读✓ 已解决
1 回答2.6k 阅读✓ 已解决
2 回答762 阅读✓ 已解决
2 回答1.8k 阅读
2 回答1.7k 阅读
2 回答1.3k 阅读
java内部其实是使用的
UTF-16
的编码,所以是支持大部分非生僻汉字的。上面那个文档的意思是说java不能支持世界上全部的文字,如果你用的字母不在这个
UTF-16
的标准里,那么程序会出错,所以你需要自己采用补增字符的方式解决。不知道给出oracle官方连接那哥们写没写过这样的代码
额外知识补充
unicode
并不是一个具体的字符集,而是一类标准。其中包含好几种具体的字符集,有
定长,双字节表示一个字符的:
UTF-16
;定长,四字节表示一个字符的:
UTF-32
;不定长,1-4个字节表示一个字符的:
UTF-8
; (英语一般一个字节,汉字一般三个字节,特殊的生僻字四个字节)。所以请不要一张嘴就说 双字节不支持unicode编码。