文件编码问题
概念:呈现再我们眼前的所有文字字符都是unicode 字符集, unicode 字符集如何保存?通常是用不同的编码编码成字节来存储,常见的有utf-8, gb2312等
- windows 默认编码是gb2312
- latin-1 兼容 ascii
文件乱码问题
乱码通常是我们无法用正确的解码方式来将字节解码成unicode, 而出现乱码
- unicode 经过编码方式1 编码成字节存储,我们用编码方式2 将字节解码成unicode
- 编码1与编码2 不一致就会出现乱码问题;
vim 编码的几个配置
- encoding: vim 软件本身的编码方式,通常不用修改;
- fileencoding: 设置vim 保存文件的编码方式;
fileencodings: vimrc 配置中候选的编码方式,当开打一个文件时,会从中选择合适的编码方式打开文件(将字节解码成unicode 呈现再我们眼前)
通常配置成这个 set fileencodings=ucs-bom,utf-8,utf-16,gbk,big5,gb18030,latin1
如何用特定的编码打开文件
当文件的编码不在fileencodings中,就会出现乱码
- 如果我们知道文件的编码,可以用
edit ++enc=gb2312
这种方式修改文件打开的编码;
latin-1 的作用
因为latin-1 兼容 ascii, 所以在代码中不了解文件的编码方式时,可用此编码打开文件,虽然会出现乱码,但不会出现错误;
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。