php计算字符串的gbk格式的字节长度有问题。

问题描述

理论上gbk格式下一个中文是2个字节。数字和英文是1个字节。
可是php上判断字节长度的时候发现 数字在中文后面的时候数字的长度被省略掉了

问题出现的环境背景及自己尝试过哪些方法

相关代码

// 请把代码文本粘贴到下方(请勿用图片代替代码)

mb_strlen('语音', 'GB2312')); //字节长度4
mb_strlen('语音1', 'GB2312'); //字节长度4
mb_strlen('语音12', 'GB2312'); //字节长度5
mb_strlen('1语音1', 'GB2312'); //字节长度5
mb_strlen('1我你1', 'GB2312'); //字节长度6

你期待的结果是什么?实际看到的错误信息又是什么?

阅读 2.7k
1 个回答

PHP文件编码 与 mb_strlen 参数一致时,返回值是正确的
PHP文件编码 与 mb_strlen 不一致时,返回根据 PHP文件编码不同,会有不同

具体解释如下:
PHP文件编码 是 UTF-8 的时候

1语音1 的实际字节是:0x31 0xE8 0xAF 0xAD 0xE9 0x9F 0xB3 0x31 用能看 hex 格式的编辑器看下就知道了
当你采用 GB2312 做多字节长度计算的时候,首先按照上面列出的实际字节,按 GB2312 进行编码
0x31 0xE8 0xAF 0xAD 0xE9 0x9F 0xB3 0x31 => 1璇???
所以计算出来长度是 5

其他字符串参考下图
图片描述

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题