GB2312:如何理解 GB2312?GB2312 是字符集还是编码方案?

Unicode 为字符集,UTF-8、UTF-16、UTF-32 均为 Unicode 的编码方案,那么 GB2312 是字符集还是编码方案呢?

阅读 2.5k
2 个回答

看看这篇华为社区的文章:字符编码 | ASCII、GB2312、GBK、UTF-8、UTF-16编码与Unicode字符集
企业微信截图_16917311816789.png
GB2312总共覆盖了6763个常用汉字,GB2312标准把ASCII码表127号之后的扩展字符集去掉,并规定,小于127(0x7F)的编码按照ASCII标准进行解码,当出现连续两个大于127(0x7F)的编码时,这两个连续的大于0x7F的编码表示一个汉字,第一二个字节都是用0xA1~0xFE进行编码。其中,ASCII码中原有的数字字符、英文字符、标点等称为半角字符,大于0x7F的相应字符编码称为全角字符。

GB2312解码规则:当使用GB2312编码标准时,给定一串字符编码,按照字节进行检测,首先检测每个字节的大小,如果字节值小于0x7F,就用ASCII标准解码,如果连续两个字节的值都大于0x7F,就把这两个字节视为一个整体,使用GB2312标准解码。

GB2312 ,全称 《信息交换用汉字编码字符集·基本集》, 所以是字符集

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进