php下怎么检测UTF-8格式的字符是否为繁体字

如果是BIG5格式的还可以用'mb_detect_encoding'来检测,但是全部统一为UTF-8以后,就没办法用这个函数检测了,是否有其它办法来检测某段文字是否为繁体字。或者退一步来讲,是否有办法把一段文字中的繁体字全部自动转化为简体字?

阅读 7.8k
2 个回答

可以把一段文字中的繁体字全部自动转化为简体字

`
$in = "繁体繁體";
$in = iconv('UTF-8', 'BIG5//TRANSLIT', $in);
$in = iconv('BIG5', 'GB2312//TRANSLIT', $in);
$out = iconv('GB2312', 'UTF-8//TRANSLIT', $in);
var_dump($out);
`
备注:数据源是UTF-8

如果要求不高可以自己建立个字典替换:

$map = array(
        '兒' => '儿',
        '幾' => '几',
        '麼' => '么',
        /* ... */
    );
    /*自己查找替换*/
   $str = '兒童';

或者使用其他的转换插件,比如openccc的php扩展:http://code.google.com/p/opencc/

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题