背景
数据量:数据量大约3000w+ ,数据大小10g,索引30g,如下图。
需求:需要比较多的group by 操作和全量数据操作。
问题:各种group by 特别慢。
已尝试方案:
1:尝试放es,但操作非常不方便。
2:数据表分表,成本比较大,从时间和业务角度都没有比较好的分表方案。
3:读写分离,分离之后效果提升不大。
4:在尝试postgresql,但需要业务较大的变动,暂未试试。
求存储或者优化方案,最好是存储在mysql上优化,其他存储介质也可以。
数据量:数据量大约3000w+ ,数据大小10g,索引30g,如下图。
需求:需要比较多的group by 操作和全量数据操作。
问题:各种group by 特别慢。
1:尝试放es,但操作非常不方便。
2:数据表分表,成本比较大,从时间和业务角度都没有比较好的分表方案。
3:读写分离,分离之后效果提升不大。
4:在尝试postgresql,但需要业务较大的变动,暂未试试。
求存储或者优化方案,最好是存储在mysql上优化,其他存储介质也可以。
group by 优化方案
Loose Index Scan和Tight Index Scan 。中文叫做松散索引扫描和紧凑索引扫描
具体可以参考官方文档
http://dev.mysql.com/doc/refm...
postgresql对多表关联和count支持速度怎样?
测试的mysql多表关联,慢!索引优化确实很关键;
还有就是多表关联后的视图,排序、count分页等速度更加难以想象。
这里想回问下你们怎么解决多表关联、视图、分页的问题,看样索引是真没少建啊。
该用的你都测试了,全量数据操作我也没想出来什么好的办法了。
对于group by操作,如果是固定的sql(业务需要),
1)可以考虑用存储过程将常用sql的结果定时生成新表的数据。
2)将常用的sql字段分拆,再优化
5 回答3.3k 阅读✓ 已解决
3 回答3.7k 阅读✓ 已解决
2 回答2.8k 阅读✓ 已解决
5 回答1.4k 阅读
2 回答2.1k 阅读
3 回答2k 阅读
1 回答3.6k 阅读
大表优化无非就建索引、数据水平切分、竖直切分,该用的你都测了,没见你把表结构和索引截出来也不好说,索引不要建太多。
建议是从业务层面上去优化,看是否需要分页,即使是全量数据操作,用预统计是否合适,是否需要冗余字段来让group by更充分利用索引。