最近在网路上看到一些奇怪的中文字,例如:
ྋ试ོ༵试ོ༵你ོ༵的ོ༵眼ོ༵力ོ༵ 请找ོ༵到ོ༵一ོ༵帆ོ༵风顺靠ོ༵靠ོ༵靠ོ༵
我试着将 靠ོ༵ 这个字找了线上的转换器 转成 utf-8
utf-8 显示结果如下
\xe9\x9d\xa0\xe0\xbd\xbc\xe0\xbc\xb5
其中 \x 的部分 我当作是 utf-8 的表达,但我查不到这是哪裡的规范?
其中 e9 9d a0 ... 我认为是 16 进制的表示,e9 将会佔 1 个 字节(byte) 的大小
查看 utf-8 定义后发现 :
通常1个字节可以存入一个ASCII码,2个字节可以存放一个汉字国标码。
也就是说 上面的这个字 用到了 e9 9d a0 e0 bd bc e0 bc b5 共 9 个字节(byte),應該不屬於中文字。
请问这样我能知道它这个字,是属于哪一国语言吗? 或者是在 utf-8 的定义中,这个字在哪个范围内呢?
取 Unicode 转二进制代入 UTF-8 xxx 部分