为 S3 构建分布式缓存

发布于 2025-08-03

Summary: 介绍了 ClickHouse Cloud 的分布式缓存，解决了在云环境中保持热点数据靠近计算节点的难题。通过将本地文件系统缓存转变为共享网络服务，实现了低延迟、高吞吐量和可扩展性，提升了查询性能和弹性。文中详细阐述了不同缓存阶段的工作原理、对比了各阶段在吞吐量和延迟方面的性能，并通过测试展示了分布式缓存的优势。
主要观点:
- 传统共享无状态 ClickHouse 集群依赖操作系统页面缓存，在云环境中存储非本地时面临挑战。
- ClickHouse Cloud 采用解耦的计算和存储架构，引入本地文件系统缓存来缓解对象存储的高延迟问题。
- 分布式缓存是共享网络服务，将文件系统缓存封装，使所有计算节点都能快速访问热点数据，解决了本地缓存的局限性。
- 分布式缓存通过网络提供介于 SSD 和内存之间的延迟，可并行获取数据，提高吞吐量，支持无盘、无状态的计算节点。
关键信息和重要细节:
- 缓存的内容包括热表数据、表元数据、中间查询数据和外部文件等。
- 不同缓存阶段的工作流程，如传统共享无状态集群的页面缓存、ClickHouse Cloud 的本地文件系统缓存和新的分布式缓存。
- 测试的两种查询类型（吞吐量受限查询和延迟敏感查询）及各缓存阶段的测试结果，包括冷启动和热运行的时间对比。
- 分布式缓存的特性，如支持 S3 和 GCS，即将支持 Azure Blob Storage，以及目前处于私有预览阶段并开放注册。

阅读 118