url编码和(utf-8,gbk)的关系

clipboard.png

clipboard.png

图一说 “春节” utf-8编码得到的是E6 98 A5 E8 8A 82

然后我用工具对“春节”进行了utf-8转码,发现是 春节

请问这是怎么回事呢?还是我理解有问题?

阅读 3.8k
3 个回答

字符: 春节
Unicode 码点(十进制): 26149 33410
Unicode 码点(十六进制): \u6625 \u8282
Unicode 码点(二进制): 0110 0110 0010 0101 1000 0010 1000 0010

Unicode - UTF-8 转换规则

Unicode utf-8
U+ 0000 ~ U+ 007F 0XXXXXXX
U+ 0080 ~ U+ 07FF 110XXXXX 10XXXXXX
U+ 0800 ~ U+ FFFF 1110XXXX 10XXXXXX 10XXXXXX
U+ 10000 ~ U+ 1FFFF 11110XXX 10XXXXXX 10XXXXXX 10XXXXXX

十六进制代入表格选择对应
二进制代入表格对应 XXX 位置

得 UTF-8:

二进制
11100110 10011000 10100101
11101000 10001010 10000010

十六进制
E6 98 A5
E8 8A 82

最终编码
%E6%98%A5%E8%8A%82

"然后我用工具对“春节”进行了utf-8转码,发现是 春节", 这样写
"然后我用工具对“春节”进行了utf-8转码,发现是 & # x6625; & # x8282;", 浏览器会自动转识别unicode

https://www.zhihu.com/questio...

UTF-8 和 Unicode 的区别和关系,
一个编码规则 一个字符集, 

Unicode: 编码规范 用一种编码包括世界上所有的文字
UTF-8:Unicode的一种实现,类似的还有UTF-16等
GBK:GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification) ,中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式,将它确定为技术规范指导性文件。就是中国内部用的

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏