我写了一个html文件,用的是utf-8的编码格式,然后我在文本中随便写了一段中文。鼠标双击打开,发现是乱码。这个很正常,我能理解。但是,我把这个文件拿到web服务器上去之后,不做任何改动,通过服务器访问,发现这个文件输出的不再是乱码了,而且,我随意修改文件内charset的值,例如改成gb2312。他始终不会出现乱码。请问这是为什么,是走了服务器之后会发生什么变化吗???
<!DOCTYPE html>
<html>
<head>
<meta charset="gb2312">
<title></title>
</head>
<body>
这是一个测试文件。
</body>
</html>
这就是我写的文件
然后我怀疑一个问题,因为这个文件在服务器上的访问是静态访问,有没有可能静态服务器获取到这个文件的同时得知了这个文件的编码方式,于是让浏览器必须以这种编码方式解析,不管我怎么改charset,页面始终正常显示中文字符,但服务器是怎么告诉浏览器这个信息的呢?
为了离真相更近一点,我做了另一个尝试,保证浏览器只接受到文本内容,我用node开了一个简单的服务,每次只会传送文本内容,这次的结果,终于乱码了。
'use strict';
const fs = require('fs');
const http = require('http');
http.createServer(function(req, res) {
fs.createReadStream('./test.html').pipe(res);
res.on('finish', () => {
res.end();
});
}).listen(4000, () => {
console.log('Listen on port 4000.');
});
有谁明白这里面的缘由吗???
你仔细看一下是不是服务器自动向浏览器输出了header头,或者你浏览器设置了编码为自动?