如何解决 UTF 文档中的乱码问题?

在浏览器中 Unicode 状态下,我看到这样的一个乱码,我尝试用 PHP 进行解码,失败了... 不过简单的文件编码转换,就成功了,步骤是这样的:

  1. 保持内容为 Western (ISO8859-1)格式

  2. 用浏览器开启,设置编码为 GB2312,完成

问题是这样的,我的文件如果必须要用 UTF8 编码,如何把这段乱码解码呢?

乱码内容是: '²»ÖªµÀÕâÑùµÄÖ÷»ú¡£'

阅读 3.5k
2 个回答

PHP扩展iconv是用来进行编码转换的。
转码方法为:

$text = iconv("ISO-8859-1", "UTF-8", $text)

答案没有那么简单,我刚刚试了一下,正确的方案是这样的

var_dump($str = iconv("UTF-8", "ISO-8859-1", '²»ÖªµÀÕâÑùµÄÖ÷»ú¡£'));
var_dump($str = iconv("GB18030", "UTF-8", $str));

首先要解码为 ISO-8859-1,不过这个状态下还是乱码,所以还要再转为 GB18030,然后再还原到 UTF-8 (与所在的文件匹配的编码)。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏