做两个小测试
(a) utf8编码情况下,发送post请求,携带页面输入的emoji表情
<?php
header("Content-type:text/html;charset=utf-8");
$out = <<<HEREDOC
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<style>
div.emoji{
font-size:20px;
}
</style>
</head>
<body>
<div>
emoji:☹
</div>
<div class="emoji">
<div>
<form method="POST" action="test.php">
emoji:<input type="text" name="emoji"/>
<button>submit</button>
</form>
</body>
HEREDOC;
echo $out;die;
提交后,抓包结果
emoji => %E2%98%B9 urldecode解码后 :即为utf-8 的编码: 0xE298B9 对应的unicode 十进制:9785
gbk编码情况下,发送post请求,携带页面输入的emoji表情
<?php
header("Content-type:text/html;charset=gbk");
$out = <<<HEREDOC
<head>
<meta http-equiv="Content-Type" content="text/html; charset=gbk">
<style>
div.emoji{
font-size:20px;
}
</style>
</head>
<body>
<div>
emoji:☹
</div>
<div class="emoji">
<div>
<form method="POST" action="test.php">
emoji:<input type="text" name="emoji"/>
<button>submit</button>
</form>
</body>
HEREDOC;
echo $out;die;
提交后,抓包结果
emoji => %26%239785%3B urldecode解码后 : 9785;(这里#和9我加了空格 不然就直接输出emoji了) 即为NCR的值 对应的unicode 十进制:9785
结论
- 当前编码环境为unicode下的某一种,比如utf-8,则页面内的emoji对应的unicode号码进行相应的编码后,发送到服务器
- 当前编码不是unicode下的,比如gbk,则页面内的emoji对应的NCR结果被发送至服务器
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。