Go 语言的字符串的字节使用 UTF-8 编码标识 Unicode 文本是什么意思?

这里是不是说的矛盾?
Go 字符串

Go 语言的字符串的字节使用 UTF-8 编码标识 Unicode 文本。

UTF-8是一种编码,Unicode也是一种编码,只能取其一,这里指的是什么意思?

阅读 274
评论
    1 个回答

    Unicode 是字符集(Charset),UTF-8 才是编码(Encoding)。

    Unicode 只规定了字符和二进制的映射关系,没规定存储的编码方式,UTF-8 就是其中一种编码方式。

    有关具体的区别,搜 “UTF-8 和 Unicode 的区别” 这个关键字就可以了。


    常见字符集和编码:

    • Unicode 字符集:有 UTF-8UTF-16UTF-32 等多种编码;
    • ASCII 字符集:本身既是字符集、又是编码;
    • CB2312 字符集:只有 EUC-CN 这一种编码。
      撰写回答

      登录后参与交流、获取后续更新提醒