几百万数据的群聊要怎样分表？

有两张表，群表，群成员表，现在成员表比较大想进行分表

想到有两种分表方法，按人分或按群分

如果按人分，查询哪个人加入过哪个群很容易，但查询群有多少人报名就要用UNION去查了

如果按群分，查询群有多少人报名很容易，但查询哪个人加入过哪个群就要用UNION去查了

请问有什么好的方案可以令上面两个需求都可以高效查询，分表是为了减少查询压力，但用UNION又会增加查询压力，违背分表的初衷了

数据库设计

mysql mysql优化 php oracle

阅读 6.8k

8 个回答

得票最新

vincent

1.6k129

发布于
2017-03-17

推荐使用hash方式分表，根据用户id进行hash分表，假设你有1亿的聊天记录，那么不到100张表也够了。

machenchi0207

1.2k42636

发布于
2017-03-17

我觉得是不是改动一下群表，把用户队列值写进去:'1,2,3' 然后成员表按用户id范围分一下表
不然的话你两个操作都要效率高我觉得有点矛盾啊

jacky1988li

132

发布于
2017-03-17

建立两个关联表来统计，报名表和用户加群表。

Juice

126413

发布于
2017-03-17

如果id分布均匀，那就按照uid hash分表，没什么问题，查询用户加入过哪些群也很简单。查询群有多少人报名就要用UNION去查了。如果仅仅是想查多少人报名，比较容易解决：

可以改下表的设计，在群表加入一个用户数的字段也可以解决问题，查询的时候直接查群表就好了；
或者采用redis的计数器来存群人数。

当然，还是还有一个问题没法解决，就是如果你想查群成员列表，还是得用UNION去查了。

我也想知道怎么解决，题主如果有解决方案了，麻烦分享一下。多谢。

qinjianxiang

5.9k71318

发布于
2017-05-04

专门用一个表存储用户ID 和群ID 的映射关系。
这两个ID都是整数（int或者bigint），单表几千万行都可以的。

数据库前还可以加个缓存，按人，按群都可以缓存，不仅是缓存映射关系，还缓存群名称、人在群里的昵称等数据。

分表能解决一部分性能问题，但会带来应用开发上的困难。如果能确定数据在百万行规模，不需要分库分表。

邢爱明

5k72135

发布于
2017-05-04

建议按照用户ID分表。群应该是动态变化的（用户可以申请建群），分表的难度比较大。
查询群有哪些用户，建议在群的表里面增加冗余字段，保存用户列表的信息，只有查询用户详情的时候才关联用户表。

另外像@qinjianxiang所说，如果确认数据量在百万级别，从数据库性能看还没有到必须分表的地步。

每天多笑笑

39714

发布于
2017-05-04

推荐使用hash方式分表，根据用户id进行hash分表

赫赫张

25093850

发布于
2017-05-04

查询哪个人加入过哪个群查询群有多少人报名

需求就是这个，如果要提高查询速度，思路肯定是空间换时间。
加入过和报名人数应该是不完全一样的
建议建两个关联关系表

撰写回答

你尚未登录，登录后可以

和开发者交流问题的细节
关注并接收问题和回答的更新提醒
参与内容的编辑和改进，让解决方法与时俱进

推荐问题

相似问题

找不到问题？创建新问题

几百万数据的群聊要怎样分表？

你尚未登录，登录后可以

我们知道MySQL字段可以存放纯文本，但是富文本有图片，有标题样式等情况，一般是怎么进行存储的呢？

如何在SpringBoot/MySQL事务中并行执行多条SQL？

求java/php大佬帮帮忙？

新人求看下如何用php对接第三方接口?

Hyperf Swagger 如何使用？

上面的sql通过login_time排序但是结果不对？

er图一对多与多对一关系？