如何用PHP匹配并替换iOS标准的emoji表情符号

遇到一个问题,要储存iOS键盘输出的emoji表情到MySQL,我知道用blob+utf8是可以存的。但是现在我的这张表已经太大了,不可能去改类型。所以就想把emoji表情匹配出来,替换掉,再存。
但是,iOS键盘输入的emoji表情,并不是标准的0xe001 - 0xe537这种,而是变化过的。
例如:第一个大笑的表情,标准emoji unicode是 0xe415 而iOS键盘输出的是 0xd83dxde04 两位。
我用preg_match() 去做匹配

preg_match('/\\x{d83d}\\x{de04}/', $str_with_emoji_emotion, $matches);
var_dump($matches);

打印出来是个 NULL

求助各位大神,怎么才能匹配这种表情符号啊。。。

补充:我用 preg_match('/[\x{0000}-\x{FFFF}]/u', $str_with_emoji_emotion, $matches); 去匹配都匹配不到。。。我怀疑是这个表情符号的问题,继续研究。。。继续求解。。。

补充2:今天搞定了,做了 bin2hex 的转码 http://jiajun.org/g/emoji_encoder.php

阅读 28.2k
5 个回答

试试这个

preg_match('/\x{d83d}\x{de04}/u', $str_with_smail_emotion, $matches);
新手上路,请多包涵

参考这篇文章 http://www.bubuko.com/infodetail-1022211.html
里边推导了一个公式,可以把 0xd83d0xde04 转成 1f604 ,而 U+1F604 就是 Unified 编码的笑脸表情代码。
文中是 js 的函数,我提取出来了关键几行代码,转成 PHP 代码如下:

$h = 0xd83d; //高位
$l = 0xde04; //低位
$code = ($h - 0xD800) * 0x400 + 0x10000 + $l - 0xDC00; // 转换算法
echo "U+" . strtoupper(dechex($code));
//echo 结果是 U+1F604

另外不同编码方式的转换,@seeyoup 已经说了

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题
宣传栏