GBASE 8a 目前支持以下四类字符集编码:
gbk : 1、2字节编码
gb18030 : 1、2、4字节编码
gbase 8a中的utf8 :1、2、3字节编码
gbase 8a中的utf8mb4 :1、2、3、4字节编码
其中对于ASCII码,在以上四种字符集中的编码是相同的,都是单字节编码,所以只含ASCII码的文本文件,在以上四种字符集中的二进制是完全相同的,文件大小也相同。
对于中文字符,在gbk中是双字节编码,在gb18030中是双、四字节编码,在utf8中的是三字节编码,在utf8mb4中是三、四字节编码。对于常用汉字,在gbk和gb18030中都是双字节编码,在utf8和utf8mb4中是三字节编码。对于部分生僻字,在gbk中不存在,在gb18030中为双、四字节编码,在utf8中是三字节编码,在utf8mb4中是三、四字节编码。文件大小只取决于数据内容。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。