mssql或mysql大数据量(1500万到2000万左右)插入时查重

最近在弄一个图书信息管理系统,有一个表marc用来保存图书的信息,一共有20多个字段

在导入数据的时候要求根据其中的7个字段进行查重,数据量在1500万到2000万左右

目前使用的方法是,根据这7个字段创建一个键

clipboard.png

在导入数据的时候客户端通过捕捉错误的方式来进行查重

现在想问的是有没有更好的解决方法,或者设置触发器对这种情况是否可行

因为数据全部导入之后索引太大了,现在想看看有没有其他方法可以避免这种情况

数据库 SQL server 2008R或者 MySql 5.8+都可以

阅读 3.3k
1 个回答

可以七个字段相连获取hash值,然后建一个hash表,在数据库外自己去重

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题