mssql或mysql大数据量（1500万到2000万左右）插入时查重

发布于
2019-02-15

最近在弄一个图书信息管理系统，有一个表marc用来保存图书的信息，一共有20多个字段

在导入数据的时候要求根据其中的7个字段进行查重，数据量在1500万到2000万左右

目前使用的方法是，根据这7个字段创建一个键

在导入数据的时候客户端通过捕捉错误的方式来进行查重

现在想问的是有没有更好的解决方法，或者设置触发器对这种情况是否可行

因为数据全部导入之后索引太大了，现在想看看有没有其他方法可以避免这种情况

数据库 SQL server 2008R或者 MySql 5.8+都可以

阅读 3.3k

1 个回答

发布于
2019-02-16

可以七个字段相连获取hash值，然后建一个hash表，在数据库外自己去重

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题