抓xx页面的时候,虽然返回数据为json
格式的,但是是非utf-8
的,这样json_decode
的时候返回的是null
,因为json
只是支持UTF-8/ASCII
,应该也有其他转换方法,这里仅记录一下。
$info='
场景说明:此变量存储的为:通过xx等方式获取到的字符串,
拿到后浏览器为乱码(实际为gb2312),转化编码格式后为正常数据,
拿到`bejson.com`中也为valid json,
但是json_decode此码就是为null
';
// 得到目前编码
$encode=mb_detect_encoding($info,array(
"ASCII",'UTF8','GB2312',"GBK",'BIG5'
));
echo $encode."\n";
$result=json_decode($info);
var_dump($result);
// 转化编码
$trans=mb_convert_encoding($info,'UTF-8',"gb2312");
$encode = mb_detect_encoding($trans, array(
"ASCII",'UTF-8','GB2312',"GBK",'BIG5'));
echo $encode;
$obj=json_decode(($trans));
var_dump($obj);
字不如图~
PS:
EUC-CN EUC-CN是GB2312最常用的表示方法。浏览器编码表上的“GB2312”,通常都是指“EUC-CN”表示法。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。