mb_detect_encoding()函数检测不准确。

新手上路,请多包涵

我想通过mb_detect_encoding()函数动态获取某个字符的编码集,再通过iconv进行编码转换,但是mb_detect_encoding()判断的编码类型不准,导致iconv()失效或乱码。

//片段
if (is_string($k)) {
    $encoding = getEncoding($k);
    $k = iconv($encoding, "utf-8", $k);
}
//获取编码集
function getEncoding($data)
{
   return mb_detect_encoding($data, array("ASCII","GB2312","GBK",'BIG5','UTF-8'));
}
//测试
$k = "哈哈";
$encoding = getEncoding($k);
var_dump($encoding,$k);
$k = iconv($encoding, "utf-8", $k);
var_dump(getEncoding($k),$k);exit;

//输出:string(5) "CP936" string(6) "哈哈" string(5) "CP936" string(9) "鍝堝搱"
阅读 6.9k
2 个回答

mb_detect_encoding — 检测字符的编码

string mb_detect_encoding ( string $str [, mixed $encoding_list = mb_detect_order() [, bool $strict = false ]] )

可见第二个参数是非必填的, 如果省略了 $encoding_list 将会使用 mb_detect_order() 自动获取字符集, 所以可对代码做如下调整:

return mb_detect_encoding($data);
return mb_detect_encoding($data, mb_detect_order());

修改后的code

<?php
/**
 * 获取编码集
 */
function getEncoding($string)
{
    return mb_detect_encoding($string, mb_detect_order());
}

//测试
$k = "哈哈";
$encoding = getEncoding($k);
var_dump($encoding, $k);

$k = iconv($encoding, "utf-8", $k);
var_dump(getEncoding($k), $k);

exit;

// 示例图

图片描述

新手上路,请多包涵

@蒋建勇
clipboard.png
老哥,我不是要抬杠哈,比如我输入了一串英文,获取字符集结果为ASCII,然后通过iconv转成utf-8了,后面应该返回utf-8才对。为什么还是返回的ASCII呢?我是比较疑惑的这一点。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏