用自增主键还是用多字段MD5做主键?(需要不重复约束)

200106985

发布于
2019-03-22

场景:

现有用户黑名单表, 需要身份证号和手机号联合确定唯一标识, 每天需要往里增量更新数据.
所以, 要求:
1) 查询时, 根据 身份证 或手机能够快速查询.
2) 增量更新时要尽可能提高速度.

思路一:

我的思路是:
1) 设置自增主键. 自增主键的好处就是可以增加插入时的效率. 以为会减少主键索引树的分裂重建(Innodb引擎).
2) 身份证和手机号一起取md5, 设为唯一键, 作为唯一约束, 以方便sqoop导数据时根据该字段, 选择更新还是新插入.
这样的话, 起码要有四个索引: 主键, 身份证+手机号md5, 身份证号, 手机号.

思路二:

以前我的做法就是直接用 身份证+手机MD5 作为主键.

请大神指点, 哪种思路更优?

mysql 优化索引主键

阅读 8.8k

3 个回答

得票最新

总是迟到

1.2k139

发布于
2019-03-25

推荐自增主键，
MD5导致乱序插入，而且太长，影响二级索引。
要保证唯一性，身份证+手机号建唯一索引，
如果还需要根据身份证或手机号的单一条件查询，身份证从存储的角度比手机号长很多，额外建一个手机号的索引就可以了。而身份证的谓词条件可以用到上面唯一索引的最左前缀匹配。

梦一如年

发布于
2019-03-22

个人觉得模型可以这么设计：
1.DB层面，如果是单机模型，还是选用自增主键的方案，然后手机号和身份证号可以作为索引字段，可以考虑组合索引。如果是集群模型，选用雪花算法的主键。
2.Cache层面，如果是为了check黑名单的话，这里可以先采用布隆过滤器做第一步的拦截。如果布隆过滤器已经饱和，再去DB查询就好。

鸠拉森林的史莱姆

1.7k1515

发布于
2019-03-22

黑名单这种数据量不大没扩展需求的找不到不用自增主键的理由?️

另外布隆过滤器是有误杀可能的……和这种手机身份证的黑名单业务就不是很适用

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

用自增主键还是用多字段MD5做主键?(需要不重复约束)

场景:

思路一:

思路二:

你尚未登录，登录后可以

Java 开发 URL 匹配问题？

如何优雅地给多层嵌套的对象赋值？

请问主键的约束定义是否可以这样写？

为何无法连接阿里云轻量应用服务器上 docker 中的 mysql ？

mysql 死锁问题？

MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？

为了防止过多索引拖慢数据库，数据库动态创建索引，隔几天就换一套索引，会有什么问题？

用自增主键还是用多字段MD5做主键?(需要不重复约束)

场景:

思路一:

思路二:

你尚未登录，登录后可以

Java 开发 URL 匹配问题？

如何优雅地给多层嵌套的对象赋值？

请问主键的约束定义是否可以这样写？

为何无法连接 阿里云轻量应用服务器上 docker 中的 mysql ？

mysql 死锁问题？

MyBatis Plus 如何对敏感字段加解密（使用哪种加密方式）？

为了防止过多索引拖慢数据库，数据库动态创建索引，隔几天就换一套索引，会有什么问题？

为何无法连接阿里云轻量应用服务器上 docker 中的 mysql ？