2025 年:你如何在 Doris 和 ClickHouse 之间做出选择?

主要观点:数据库选择是数据工程师面临的挑战,Apache Doris 和 ClickHouse 常被比较,各有优势适用于不同场景,选择困难。
关键信息:

  • 曾为大集团管理数据平台架构,需在 ClickHouse 和 Doris 间做选择,经过近两个月测试才决定。
  • Doris 采用 FE 和 BE 分离架构,集群管理简单;ClickHouse 为单机系统,构建集群需配置分布式表和依赖 ZooKeeper,大规模集群管理复杂。
  • ClickHouse 在单表查询性能尤其极端性能要求场景表现出色,Doris 在复杂 SQL 分析性能好,支持多表连接等,且支持同步更新和删除,数据一致性好。
  • Doris 易用性强,支持标准 SQL 语法和 MySQL 协议,社区活跃;ClickHouse 用自己 SQL 方言,学习曲线高,缺乏一些标准 SQL 功能。
  • 选择指南:ClickHouse 适用于极端查询性能要求、数据模型固定、有专人维护、数据更新不频繁场景;Doris 适用于复杂 SQL 分析、实时数据更新、注重维护易用性、多数据源集成、高并发查询场景。
    重要细节:
  • Doris 的 FE 处理元数据管理和查询规划,BE 负责数据存储和执行引擎,支持自动平衡和故障恢复。
  • ClickHouse 的 update 和 delete 操作异步,Doris 同步,Doris 的 UniqueKey 模型通过 Merge-on-Write 实现真主键去重,性能比 ClickHouse 好 10 倍。
  • 朋友的数据团队中现有 MySQL DBAs 能快速掌握 Doris 提高效率。
  • 快手案例中 Doris 的湖仓能力提升查询性能并简化数据治理。
    结论:选择数据库无绝对对错,要根据业务场景选择,两者都在快速发展,竞争将加剧。
阅读 9
0 条评论