有大概10亿条数据,每条数据330个字节,已经按照用户ID取模分100张表,这样这个库里有100张表;
分表解决的是单表数据量大的问题;
请问有没有必要再分10个库,每个库有10张表?
有大概10亿条数据,每条数据330个字节,已经按照用户ID取模分100张表,这样这个库里有100张表;
分表解决的是单表数据量大的问题;
请问有没有必要再分10个库,每个库有10张表?
如果不用一致性哈希的话,按2的次方数()分会比较好。加入数据量上涨,只需要翻倍、再翻倍就行了。如果你是10、100、1000这样分的话,一次翻10倍,成本比较高。
更正
看错题主的场景了。按ID水平分割的话,我认为可以只分库,一个库里一个表就可以了。一个库里10个表,每个表1千万条数据,跟一个库里1个表,每个表1亿条数据,其实性能差不太多的。
5 回答1.5k 阅读
2 回答2.2k 阅读
3 回答736 阅读✓ 已解决
1 回答1k 阅读
1 回答681 阅读✓ 已解决
1 回答982 阅读
1 回答859 阅读
分表考量的不只是单表数据量,还有磁盘网络io,10Y的数据再加后续增量的话,业务繁忙建议还是分成不同的实例,每个实例再分库分表,主要目标数据流量打散