前言
相信很多人在使用PHP的过程中都遇到过生成文件乱码的情况,不论是使用fwrite
还是file_put_contents
写入。
可能你会先尝试从编码入手尝试解决,但最终的结果往往是不理想的,尽管我们都将其转换为了UTF-8
编码了...
那么究其根本原因是什么呢?
一句话:缺少头部BOM(当然,这里指的肯定不是Js的Bom)
BOM
既然提到了BOM,那么可能有的同学不太了解这个家伙,这里我简单说一下,老鸟可以跳过。
在Windows
下用记事本之类的程序将文本文件保存为UTF-8
格式时,记事本会在文件头前面加上几个不可见的字符(EF BB BF
),就是所谓的BOM(Byte order Mark)
。
不仅限于 记事本保存的文件,只要在文件的开口包含了“EF BB BF”
几个不可见的字符(十六进制应该是是xEFxBBxBF
,用二进制编辑文件可见)。这像是一个约定俗成的东西,当系统看到这玩意的时候,就会觉得你这个文件是UTF-8
编码的。
这就是为什么当文件没有BOM时,你给用户呈现的文件就可能是乱码的原因了。
PS : 其实你可以将BOM理解成HTML中的charset属性和XML中的encoding属性,就是起一个标识作用。
方案
那么如何在PHP
中输出BOM
呢?
答案是在所有内容输出之前输出:
print(chr(0xEF).chr(0xBB).chr(0xBF));
当然,如果你是在生成文件,可能是下面两种:
fwrite($file, chr(0xEF).chr(0xBB).chr(0xBF));
file_put_contents($file, chr(0xEF).chr(0xBB).chr(0xBF));
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。