[Paper Reading] 深度解读SingleStore在HTAP和云原生的核心技术和创新亮点

分享人：印才华（恒义），阿里云数据库高级技术专家，AnalyticDB PostgreSQL 存储引擎和执行引擎团队研发负责人。

摘要：HTAP & 云原生是如今数据库技术演进的两大热点方向。HTAP 代表既有传统的 HANA Delta RowStore+Main ColumnStore，Oracle In-MemoryColumnStore 等方案，也有像 TiDB，Snowflake Unistore这样新的技术架构；云原生代表则是以 S3 为低成本主存的 Snowflake，Redshift RA3，提供灵活弹性和Serverless 能力。SingleStore 则是首次把两者结合起来，基于计算存储分离的云原生架构，用一份存储提供低成本高性能的 HTAP 能力。本次论文分享围绕 SingleStore 在 HTAP 和云原生的核心技术和创新亮点展开，同时包括和业界技术对比探讨。

目录：
一、HTAP - 统一数据存储
二、云原生 - 存储和计算分离
三、总结 - SingleStore 的云原生HTAP

一、HTAP - 统一数据存储

1、业界的HTAP解决方案
2022 发表在 SIGMOD 的这篇论文《HTAP Database: What is New and What is Next》中，介绍了 HTAP 数据库的架构。HTAP 数据库主要分为四部分：

主行存储+内存中列式存储（Primary Row Store + In-Memory Column Store）
分布式行式存储+列式存储副本（Distributed Row Store + Column Store Replica）
磁盘行式存储+分布式列式存储（Disk Row Store + Distributed Column Store）
主列存储+增量行式存储（Primary Column Store + Delta Row Store）

论文下载地址：https://dl.acm.org/doi/pdf/10...

值得注意的是，在下表中列出的典型数据库，在论文发表后，其中一些数据库有了新的发展方向：
SingleStore 数据库已经不再是“分布式行式存储+列式存储副本”，而属于第四部分“主列存储+增量行式存储”数据云公司 Snowflake 于近期发布 Unistore 存储引擎，属于第二部分“分布式行式存储+列式存储副本”