php 碰到一个中文乱码引起的神奇的问题

比如

$data = '百度�腾讯,阿里';

$data1 // 是一个变量 打印出来就是 '百度�腾讯,阿里'

var_dump($data);
var_dump($data1);

打印结果:
$data:string(24) "百度�腾讯,阿里"
$data1:string(22) "百度�腾讯,阿里"

$keywordsData = json_encode($data, JSON_UNESCAPED_UNICODE);
$keywordsData1 = json_encode($data1, JSON_UNESCAPED_UNICODE);
var_dump($keywordsData);
var_dump($keywordsData1);

打印结果:
keywordsData:string(26) ""百度�腾讯,阿里""
keywordsData1:bool(false)

这是为什么啊 我想直接拿变量 但现在遇到这个问题,求解答,谢谢

阅读 9.6k
2 个回答
$data:string(24) "百度�腾讯,阿里"  //这里8个字符,utf-8中的中文占3个字符,因此长度为24
$data1:string(22) "百度�腾讯,阿里" //这里长度为 22,说明不是utf-8 而json_encode不支持非utf-8字符
//输出错误看看
var_dump(json_last_error());

两个变量不一样,虽然都是字符串,但是长度一个24,一个22,第二个很明显不是UTF8编码,json_encode当然会错误。

你可以先检测下字符串编码,mb_detect_encoding,然后再转成UTF8,mb_convert_encoding

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题