2

在PHP网站中,怎样防止别有用心的人注册跟其他用户不易分辨的用户名?

比如0和O,1和I或者l,5和S,Z和2等,
另外包括但不限于使用希腊字母,西里尔字母,俄文字母或者其他拉丁系语言的字母来高仿英文字母的,以及使用中日汉字里面看起来差异非常小的汉字(也可以使用差别不大的简繁体中文汉字在)作为高仿用户名。

怎样才能尽量避免这种情况发生?

ivanilla 2.8k
2017-02-11 提问
10 个回答
33

已采纳

我这里有一个 ·真· 防伪造用户名方案。

那就是用GD绘图画出两个用户名,然后用图片相似度算法算出匹配度。就知道是不是仿冒他人了。

我感冒了 vs 娃娃脾气
clipboard.png

娃娃脾气 vs 哇哇脾气
clipboard.png

shellus vs she11us
clipboard.png

然后取出黑色部分的像素数量,即可得到两个文本的相似度了

<?php
/**
 * Created by PhpStorm.
 * User: shellus
 * Date: 2017-02-12
 * Time: 19:34
 */

require 'vendor/autoload.php';

use Intervention\Image\ImageManager;

// create an image manager instance with favored driver
$manager = new ImageManager(array('driver' => 'gd')); // imagick

// to finally create image instances
$img = $manager->canvas(800, 100, '#fff');

$img->text('蛙蛙脾气', 0, 0, function(\Intervention\Image\AbstractFont $font) {
    $font->file('src/fonts/msyhbd.ttc');
    $font->size(100);
    $font->color('#000');
    $font->valign('top');
});
$img->text('娃娃脾气', 0, 0, function(\Intervention\Image\AbstractFont $font) {
    $font->file('src/fonts/msyhbd.ttc');
    $font->size(100);
    $font->color('#ff0');
    $font->valign('top');
});

$img->save('bar.png');
1
回复 ivanilla

这个算法你需要参考php识别验证码之类的代码。来学习如何使用GD之类的图像处理库,并且学习一下图像处理入门级的知识,就可以实现了,加油!

娃娃脾气 · 2017年02月12日

1

问下这个图片相似度算法要装PHP扩展吗?我是用Laravel框架写的,有没有现成的package呢?

ivanilla · 2017年02月12日

3

这个方式碉堡了,开脑洞,但是数据一大不得挨个匹配了

hypots · 2017年02月14日

展开评论
2

这玩意儿,程序自动处理并不能完全解决问题,可以先用程序处理一遍,无法确定的就放入待定区进行人工审核。说一下我的思路:

  1. 如果用户名包含别人的用户名,比如原有abc,再注册一个abc123,这个就要毙掉了;

  2. 检测字符的编辑距离,php里面有个函数levenshtein可以看看;

  3. 其他特定相似字符的判断,建一个黑名单。

1

首先应当创建相似字符的对应表,即0与o的一个全量集合,这一块需要人工处理(可以使用更加高科技的手段,如果你会的话),然后创建用户名时首先允许他创建,然后定时任务的分析包含这些相似字符的用户进行匹配,然后封锁帐号,并要求其联系管理员解封

1

最初方案:

  1. 把用户名作正规化处理,例如0和o等价,就把Hell0正规化成Hello,规则多复杂都可以(大小写,vv转w之类)。

  2. 把正规化后的名字保存起来以便下次注册的时候判断(放数据库,Redis,实现个bloom filter都可以)

和 @娃娃脾气 思路相似的是感知哈希,用DCT hash效果还可以,但还是要解决搜索问题。

把这两个思路结合起来:

  1. 遍历字符集合,用图像相似性构造出字符的等价类(解决了规则构造的问题)

  2. 用户注册时根据等价类把用户名正规化,保存到bloom filter供下次注册判断(解决搜索问题)

0

这样避免感觉规则有点大,给id,昵称可以随意变

0

屏蔽这些字 不给注册

0

好吧,说一下本屌的思路,毕竟心有多大,需求就有多大

您需要建立一张表来存取可能匹配到的字段名,然后写一个字符匹配对照类,比如我Tom注册的时候,然后我发现这个o可能被人利用啊,顺带把T0m这个昵称放到新建的那个表上,同时绑定到新用户的id上,当然我这个从表一般只是用户注册或者更改昵称的时候查一下,有的话就提示这人注册了啊,别整成这样了?

0

你做的应该是论坛社区之类的吧 如果想防止用户仿冒ID的情况发生不只是单单从用户ID上来区分 应该从用户头像 用户等级上也做出区分 一个完善的社区应该也包括这些 看看贴吧的也是允许高仿ID的 况且社区论坛都是弱关系社交 即使有高仿ID也不会出现什么情况 而且贴吧这么多用户量都不考虑这个高仿ID 一些小的论坛用户量更小 完全没必要考虑这个

0

说一个防止使用其他拉丁语系字母高仿英文字母的好方法,那就是:
用正则表达式!
但对于使用相似度很高的字母高仿数字(或相反),以及使用中日汉字(如果正则允许的话)之间微小差异的特点来注册的高仿ID无效。

0

这不是我的名字吗?有人仿冒我?

该答案已被忽略,原因:不符合答题规范 - 内容不是答案,可用评论、投票替代

撰写答案

推广链接