查了下gb2312只能表示简体中文(6000多个汉字),而gbk是gb2312的扩展(兼容gb2312),可以表示(2万多个汉字)。
<html>
<head>
<title></title>
<meta charset="gb2312">
</head>
<body>
简体中文
繁體中文
</body>
</html>
运行上面代码的时候,发现繁體中文
可以正常显示的,并不会乱码,哪里错了吗?
查了下gb2312只能表示简体中文(6000多个汉字),而gbk是gb2312的扩展(兼容gb2312),可以表示(2万多个汉字)。
<html>
<head>
<title></title>
<meta charset="gb2312">
</head>
<body>
简体中文
繁體中文
</body>
</html>
运行上面代码的时候,发现繁體中文
可以正常显示的,并不会乱码,哪里错了吗?
4 回答13.2k 阅读✓ 已解决
5 回答7.7k 阅读✓ 已解决
6 回答2.7k 阅读
1 回答9.5k 阅读✓ 已解决
2 回答5.1k 阅读✓ 已解决
2 回答3.5k 阅读✓ 已解决
3 回答4.4k 阅读
在 Windows 上,GB2312 是 cp936 的别名,它是 GBK 或者 GB18030 我不太清楚了。
在其它平台,GB2312 还是真正的 GB2312,比如你在 Linux 上拿 Python 解析国内声明为 GB2312 的网页时一遇到生僻字或者繁体字就会报错了。
前一命令在「體」字上转码出错了,后一命令成功执行。