数据存在(重复)检测

暂时能想到三个方法

  1. 交给数据库处理,数据库设置 UNIQUE

  2. 交给数据库处理,每次 INSERT 之前执行 SELECT, 但这样随着数据增大 SELECT 次数会不断增加

  3. 交给语言处理,将已有数据存在数组中,用 in_array 等处理,但是随着数据增加数组会变得非常庞大

暂时想到的三个处理方法,觉得都不是很好
你们会用怎样的方案呢

阅读 3.9k
2 个回答

请用UNIQUE的索引,在插入时使用INSERT IGNORE语法

好处是:

  1. 性能不差,INSERT IGNORE会自动在UNIQUE的索引里检查是否有重复项,由于是索引,所以比较发生在内存里

  2. 好用,成功就返回插入行数,失败就返回0

在你的数据量达到几百万之前,这个方法都还是比较可靠的

什么场景说说

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题