js 过滤微信昵称的表情符号

微信昵称：

1.最多显示8位中文字符/16位英文字符，超出部分用“...”代替，
2.对于无法识别的表情等特殊字符，用“口”代替

现在碰到表情符号无法识别，想让他过滤成“口” ；有没有大神教教怎么写这个js和正则

阅读 9.6k

我先说一下我的解决方法:

// 示例名称:
var str = "阿bc?d的fg?hm天l";

// 将名称拆分为数组,注意: 这样会将表情拆分为两项,其值为代理对.
// 并且因为,代理对无法被浏览器识别,所以它们的值可能会被转化为 U+feff
var strArr = str.split(""),
    result = "",
    totalLen = 0;

for(var idx = 0; idx < strArr.length; idx ++) {
    // 超出长度,退出程序
    if(totalLen >= 16) break;
    var val = strArr[idx];
    // 英文,增加长度1
    if(/[a-zA-Z]/.test(val)) {
        totalLen = 1 + (+totalLen);
        result += val;
    }
    // 中文,增加长度2
    else if(/[\u4e00-\u9fa5]/.test(val)) {
        totalLen = 2 + (+totalLen);
        result += val;
    }
    // 遇到代理字符,将其转换为 "口", 不增加长度
    else if(/[\ud800-\udfff]/.test(val)) {
        // 代理对长度为2,
        if(/[\ud800-\udfff]/.test(strArr[idx + 1])) {
            // 跳过下一个
            idx ++;
        }
        // 将代理对替换为 "口"
        result += "口";
    }
};

再说一下我的思路:

1) 首先我知道,这些表情其实也是一种文字,它可以看做某个UTF-16 的码点.可以参见这个附录:

http://www.unicode.org/emoji/...

2) 这些表情的码点在UTF-16中是有自己的范围的.而JS中可以通过正则表达式来检测一个文字的码点值

.从而判断它的类型,同理也可以用来判断它是不是中文/英文等.在这个问题里,只需要判断其是否为中

文/英文即可.

3) 为什么是8个中文/16个英文啊?这到底是谁规定的? UTF8 是变长的,中文可能是 2-3个长度,UTF16 里面

中文和英文长度是一样的.所以我很想知道这个规则是干什么的?

PS: 这里的长度是编码单元长度,以 UTF16/UCS2 为例, 一个编码单元16位、2个字节,在UTF16下英文和中文

都是 U+0000 这样的形式,长度相等.除了部分代理对,它们的长度为2,占用32位、两个编码单元外(有无为3的我还

真不知道)。

欢迎大家来讨论.

js 过滤微信昵称的表情符号

js 如何将Key属性相同的放在同一个数组？

Next.js做纯前端是否可行？

如何实现一个深拷贝函数？

怎么获取动态弹出对话框的模拟单击？

git提交记录问题？

为什么在 JavaScript 中直接调用和用逻辑与调用方法结果不同？

什么是闭包？闭包有哪些应用场景？