本地
➜ ~ echo '你好'
你好
➜ ~ 你好
zsh: command not found: 你好
➜ ~ locale
LANG="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_CTYPE="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_ALL="en_US.UTF-8"
服务器(ssh登录)
root@hg:~# echo '你好'
你好
# 这一串玩意是utf8吗
root@hg:~# 你好
-bash: $'\344\275\240\345\245\275': command not found
root@hg:~# locale
LANG=en_US.utf8
LANGUAGE=
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=en_US.UTF-8
为什么服务端明明支持utf-8却显示为\344\275\240\345\245\275
呢? 为什么echo '你好'
就正常呢? 另外utf8有好几种吗?
如
select hex('你好');
+---------------+
| hex('你好') |
+---------------+
| E4BDA0E5A5BD |
+---------------+
怎么一个你好
有三种utf8编码呢?
344275240345245275
E4BDA0E5A5BD
你好
这个并不矛盾。
服务器端显示的'\344\275\240\345\245\275'这串字符其实就是'你好'的utf-8编码。
其中八进制的344\275\240就是“你”的UTF-8编码,八进制的345\245\275就是“好”。
在内部存储的时候都是以这些进制的数值形式存储在计算机内部的。
那为什么会显示不一样?
如果当前终端的驱动程序能够识别UTF-8编码就能打印出汉字,如果当前终端的驱动程序不能识别UTF-8编码就打印不出汉字。