主要观点:Google 为其全球分布式数据库 Spanner 引入了列存引擎,旨在解决在线事务处理(OLTP)和分析查询处理(OLAP)之间的长期冲突,目前处于预览阶段,能让 Spanner 同时处理两种工作负载,无需单独的数据仓库和复杂的 ETL 管道。
关键信息:
- 历史上用行式数据库处理高容量低延迟的 OLTP 工作负载,将分析工作卸载到单独的列式存储数据仓库。
- 列存引擎具有混合架构,能透明地维护数据的列式副本以优化分析查询,查询时优化器能智能指导到合适存储。
- 这种双存储方式结合向量化查询执行能大幅提升性能,Spanner 列存引擎能在保持 OLTP 性能的同时加速分析查询 200 倍。
- 富国银行的 Walter Lee 认为对 AI 应用有益,能支持实时推荐等系统。
- 不止 Google 在追求混合事务/分析处理(HTAP),其他提供商和开源项目也在做类似工作。
重要细节: - 列存引擎支持 Google SQL 接口,需显式查询提示启用列读取,免费试用可用,计费基于列数据消耗的额外存储。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。