同样utf8字符本地与服务端为什么结果就不同呢?以及有好几种utf8字符吗?

本地

➜  ~ echo '你好'
你好
➜  ~ 你好
zsh: command not found: 你好

➜  ~ locale
LANG="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_CTYPE="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_ALL="en_US.UTF-8"

服务器(ssh登录)

root@hg:~# echo '你好'
你好
# 这一串玩意是utf8吗
root@hg:~# 你好
-bash: $'\344\275\240\345\245\275': command not found

root@hg:~# locale
LANG=en_US.utf8
LANGUAGE=
LC_CTYPE="en_US.UTF-8"
LC_NUMERIC="en_US.UTF-8"
LC_TIME="en_US.UTF-8"
LC_COLLATE="en_US.UTF-8"
LC_MONETARY="en_US.UTF-8"
LC_MESSAGES="en_US.UTF-8"
LC_PAPER="en_US.UTF-8"
LC_NAME="en_US.UTF-8"
LC_ADDRESS="en_US.UTF-8"
LC_TELEPHONE="en_US.UTF-8"
LC_MEASUREMENT="en_US.UTF-8"
LC_IDENTIFICATION="en_US.UTF-8"
LC_ALL=en_US.UTF-8

为什么服务端明明支持utf-8却显示为\344\275\240\345\245\275呢? 为什么echo '你好'就正常呢? 另外utf8有好几种吗?

select hex('你好');
+---------------+
| hex('你好')   |
+---------------+
| E4BDA0E5A5BD  |
+---------------+

图片描述

怎么一个你好有三种utf8编码呢?

  • 344275240345245275

  • E4BDA0E5A5BD

  • 你好

阅读 3.1k
1 个回答

这个并不矛盾。
服务器端显示的'\344\275\240\345\245\275'这串字符其实就是'你好'的utf-8编码。
其中八进制的344\275\240就是“你”的UTF-8编码,八进制的345\245\275就是“好”。
在内部存储的时候都是以这些进制的数值形式存储在计算机内部的。

那为什么会显示不一样?
如果当前终端的驱动程序能够识别UTF-8编码就能打印出汉字,如果当前终端的驱动程序不能识别UTF-8编码就打印不出汉字。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题