Apache Doris 4.0.2 版本正式发布

2025-12-22
阅读 3 分钟
1.2k
亲爱的社区小伙伴们,Apache Doris 4.0.2 版本已正式发布。此版本新增了在 AI & Search、函数、物化视图、Lakehouse 等方面的功能,并同步进行了多项优化改进及问题修复,欢迎下载体验!
封面图

Apache Doris AI 能力揭秘(四):HSAP 一体化混合搜索架构全解

2025-12-18
阅读 12 分钟
1.2k
AI 时代正在重塑数据库的角色。过去,数据库主要为人类分析者提供报表与查询能力;而现在,越来越多的查询来自智能代理(Agent),它们会自动检索知识、过滤数据、组合多种信号,并将数据库作为“实时信息源”支撑推理与决策。

较 Trino 省 67% 成本,速度快 10 倍,中通快递基于 SelectDB 的湖仓分析架构

2025-12-17
阅读 4 分钟
933
导读:中通快递基于 SelectDB 构建了湖仓分析架构,补齐 OLAP 分析能力。在离线场景中,实现 2000+ QPS 并发点查;在实时场景中,仅以 1/3 原集群机器数量覆盖所有业务,90% 分析任务从 10 分钟缩短至 1 分钟内,投入产出比大幅提升。
封面图

面向 Agent 的高并发分析:Doris vs. Snowflake vs. ClickHouse

2025-12-12
阅读 6 分钟
1k
数据价值的不断升级,是过去三十年来数据库演进的核心驱动力。而 AI 的崛起,将这一需求推向新的高度:数据不仅要能被“看”到,更要能被“理解”和“创造”——这一点已在基于大语言模型(LLM)为核心的代码生成、智能对话等应用中得以验证。

浙江头部城商行:每日 700 万查询、秒级响应,Apache Doris 查算分离架构破局资源冲突

2025-12-09
阅读 5 分钟
898
在当前银行业务全面线上化、实时化的驱动下,浙江省头部城商行亟需构建一个能够同时承载海量数据加工与高并发实时查询的数据平台,以支撑精准营销、实时风控和智能决策等关键业务。
封面图

Apache Doris 实时更新全解:从设计原理到最佳实践|Deep Dive

2025-12-04
阅读 8 分钟
1k
在数据驱动决策的今天,数据的“新鲜度”已成为企业在激烈市场竞争中脱颖而出的核心竞争力。传统的 T+1 数据处理模式,由于其固有的延迟,已无法满足现代商业对实时性的苛刻要求。无论是为了实现毫秒级的业务库与数据仓库同步、动态调整运营策略,还是为了在秒级内修正错误数据以保障决策的准确性,强大的实时数据更新能力...
封面图

云上数据安全新范式:Apache Doris IAM Assume Role 解锁无密钥访问 AWS S3 数据

2025-12-03
阅读 3 分钟
828
长期暴露风险:静态 AK/SK 需硬编码于配置文件中,一旦因代码泄露、误提交或恶意窃取导致密钥扩散,攻击者可永久获得等同于密钥所有者的完整权限,引发持续性的数据泄露、资源篡改及资金损失风险;
封面图

字节跳动:Apache Doris + AI 一站式融合数据引擎的探索与实践

2025-12-03
阅读 8 分钟
1k
随着人工智能技术在业务中的渗透,我们逐渐意识到:AI 不仅是提升效率的工具,更是重构数据处理与消费方式的核心驱动力。在这一背景下,我们思考:能否构建一款「AI + Data」一站式融合的数据引擎? 它不仅能够统一处理文本、音视频等非结构化数据与传统结构化数据,还能为算法工程师提供流畅的数据开发体验,实现数据处...

Apache Doris 在小米统一 OLAP 和湖仓一体的实践

2025-12-02
阅读 6 分钟
915
小米早在 2019 年便引入 Apache Doris 作为 OLAP 分析型数据库之一,经过五年的技术沉淀,已形成以 Doris 为核心的分析体系,并基于 2.1 版本异步物化视图、3.0 版本湖仓一体与存算分离等核心能力优化数据架构。本文将详细介绍小米数据中台基于 Apache Doris 3.0 的查询链路优化、性能提升、资源管理、自动化运维、可观...

宇信科技基于 SelectDB & Apache Doris 构建实时智能的银行经营分析平台

2025-11-28
阅读 4 分钟
801
深耕银行 IT 建设领域 26 的年, 宇信科技服务超数百家金融机构,覆盖核心系统、渠道平台、风控中台等关键业务场景。其数据条线团队专注经营分析场景 20 余年,为城商行、农商行提供从报表系统到智能决策的全栈解决方案。随着银行业数字化进程步入深水区,宇信科技面临双重挑战:一方面,市场节奏的加快,让客户对“分钟...

上海证券 SelectDB 升级实践:湖仓流批一体落地与 Elasticsearch 全面替换

2025-11-28
阅读 4 分钟
626
导读上海证券引入 SelectDB 作为核心实时分析引擎,有效弥补了实时数据处理与分析的能力短板,实现湖仓一体与流批一体,同时替换了原架构中的 Elasticsearch 组件。达成了写入性能提升 4 倍,支撑 1000+ QPS 高并发访问,关键决策响应速度 200 ms,开发效率提升 50%,运维成本大幅降低的关键收益。
封面图

Apache Doris 中的 Data Trait:性能提速 2 倍的秘密武器

2025-11-27
阅读 8 分钟
810
在数据库系统的核心层,查询优化器如同一位精明的策略家,不断分析数据特征并制定最优执行计划。Apache Doris 作为一款高性能的 MPP 分析型数据库,其优化器内置的 Data Trait 分析机制,通过挖掘数据内在的统计特征和语义约束,为查询优化提供了基础设施。让我们一起来探索这个强大的功能!

压缩率提升 48%,详解 Apache Doris 存储压缩优化之道|Deep Dive

2025-11-25
阅读 9 分钟
725
本文基于 ClickBench 数据集,展示了 Apache Doris 如何通过选择压缩算法、调整数据页大小与分桶数、优化编码策略以及改进数据排序来提升压缩效率。最终,相同数据集的压缩空间从 16.08 GB 降至 8.2 GB,压缩率提升 48.6%。通过合理的调整与优化,Doris 成功在保持查询性能的同时显著降低了存储成本。

深入理解 Doris Variant:如何让 JSON 查询性能追平列存,还能承载万列索引字段?|Deep Dive

2025-11-24
阅读 9 分钟
786
摘要:在如 Snowflake、ElasticSearch、ClickHouse.... 等传统系统中,对于 JSON 的处理往往面临灵活性及性能无法兼得的困境,而 Apache Doris 的 VARIANT 类型,通过动态子列、稀疏列存储、延迟物化和路径索引等能力,实现了灵活结构 + 列存性能的平衡。本文将对该能力的实现一一讲解,全面展示其优势。

为什么实时更新场景下 Doris 查询性能是 ClickHouse 的 34 倍

2025-11-19
阅读 10 分钟
1.2k
在当今数据驱动的商业环境中,企业越来越依赖数据分析来驱动决策。无论是用户行为分析、业务报表还是运营监控,企业都需要具备快速、高效的数据处理能力。企业在数据分析能力上的演进,往往始于 TP(事务处理)系统,随着业务发展不断探索 TP 系统的扩展方案,最终走向构建独立的 AP(分析处理)系统。

从 Flink 到 Doris 的实时数据写入实践——基于 Flink CDC 构建更实时高效的数据集成链路

2025-11-19
阅读 7 分钟
1k
Flink-Doris-Connector 作为 Apache Flink 与 Doris 之间的桥梁,打通了实时数据同步、维表关联与高效写入的关键链路。本文将深入解析 Flink-Doris-Connector 三大典型场景中的设计与实现,并结合 Flink CDC 详细介绍了整库同步的解决方案,助力构建更加高效、稳定的实时数据处理体系。

Doris MCP Server 0.5.1 版本发布

2025-11-19
阅读 1 分钟
763
近日,Doris MCP Server 0.5.1 版本带来了多项企业级数据治理与分析能力的功能升级,进一步提升系统稳定性与易用性,欢迎下载体验。

浩瀚深度:从 ClickHouse 到 Doris,支撑单表 13PB、534 万亿行的超大规模数据分析场景

2025-11-19
阅读 6 分钟
883
浩瀚深度([SHA: 688292])旗下企业级大数据平台选择 Apache Doris 作为核心数据库解决方案,目前已在全国范围内十余个生产环境中稳步运行,其中最大规模集群部署于 117 个高性能服务器节点,单表原始数据量超 13PB,行数突破 534 万亿,日均导入数据约 145TB,节假日峰值达 158TB,是目前已知国内最大单表。凭借 Apache...

公开免费!Apache Doris & SelectDB 培训与认证课程正式上线

2025-11-19
阅读 1 分钟
781
随着 Apache Doris 用户群体不断壮大,用户在学习和掌握该数据库过程中面临“缺乏系统性指导”的问题。无论是初次接触的新手,还是希望在特定场景深度应用的用户,均迫切需要一套从0到1、覆盖全面的学习路径。基于此需求,飞轮科技正式推出 Apache Doris & SelectDB 培训与认证体系,旨在帮助用户从理论到实践,逐步成长为...

Apache Doris 实时更新技术揭秘:为何在 OLAP 领域表现卓越?

2025-11-19
阅读 9 分钟
867
过去那些“老派”的 OLAP 系统,只能批量处理账目,对实时性要求高的“流水账”就力不从心了。它们在面对高并发实时写入和复杂的分析查询时,常常会露出疲态,数据延迟、查询性能、并发处理和数据更新等问题层出不穷。

JSONBench 榜单排名第一! 10 亿条数据秒级响应

2025-11-19
阅读 6 分钟
733
坦白讲,每次看性能测试排行榜,我都会下意识地先找找 Apache Doris 在哪个位置。这次打开 JSONBench 的榜单,心情一如既往的期待加紧张。好在结果让我松了一口气:默认配置下就能排到第三,仅次于维护方 ClickHouse 的两个版本。不过,Doris 只能止步于此了吗?经过一系列优化后,查询时长能不能再缩短点?和 ClickHous...

Apache Doris AI 能力揭秘(三):AI_AGG 与 EMBED 函数深度解析

2025-11-19
阅读 18 分钟
926
在初步探索了 AI 函数的可能性之后,本次我们将目光投向两个更为核心的函数:AI_AGG 和 EMBED。我们将深入解析这两个函数的设计理念、实现原理及其在业务场景中的应用,展示 Apache Doris 如何通过原生的函数设计,将文本聚合与语义向量分析无缝集成到 SQL 中,为用户提供更强大、更易用的智能数据分析体验。
封面图

替换 ClickHouse,查询并发提升 7 倍!高途教育基于阿里云 SelectDB 构建秒级实时报表

2025-11-12
阅读 3 分钟
797
高途教育引入阿里云 SelectDB 替换 ClickHouse、MySQL 作为核心分析引擎,统一支撑续班与行课实时分析等核心业务。通过阿里云 SelectDB MPP 架构与向量化查询引擎,结合 SelectDB 倒排索引、Bloom Filter 等丰富索引机制,实现亿级数据量秒级多表关联查询,在 700+ 高并发查询压力下 P99 延迟低于 200ms,稳定满足核心报...

Apache Doris Summit 2025 圆满收官,一文速览峰会高光时刻!

2025-11-12
阅读 4 分钟
843
2025 年 11 月 5 日至 6 日,由飞轮科技主办的 Apache Doris Summit 2025 技术峰会圆满落下帷幕。本次峰会以 “Powering Real-Time Analytics & Search in the AI Era” 为主题,通过线上直播的形式,成功吸引了全球的 10 万+开发者、架构师和数据技术专家的参与。大家齐聚云端,共探 AI 时代背景下,数据价值释放的全新路...
封面图

Apache Doris 4.0.1 版本正式发布

2025-11-11
阅读 2 分钟
956
亲爱的社区小伙伴们,Apache Doris 4.0.1 版本已于 2025 年 11 月 08 日正式发布。此版本聚焦核心模块的打磨与优化,在 AI & Search 方面实现了重要能力扩展,同时全面提升了 Lakehouse 与查询引擎的稳定性和性能。
封面图

从 OpenSearch 到 Apache Doris:领创集团日志系统升级实践,降本 45%

2025-11-10
阅读 3 分钟
716
随着业务全球化扩展与数字化运营的深入推进,日志系统的规模和复杂度不断攀升,原有基于 OpenSearch 的日志平台逐渐难以满足成本控制、性能保障和可维护性等多维需求。为应对持续增长的数据压力和更灵活的分析场景,领创集团技术团队启动了日志系统的架构升级实践,并最终选择 Apache Doris 作为新一代日志系统的核心。...
封面图

从 Snowflake 到 Apache Doris:Planet 实时分析成本直降 80%、查询加速 90 倍

2025-10-30
阅读 5 分钟
838
Planet 是一家全球领先的金融科技企业,在零售、酒店和旅游行业的支付与税务数字化服务领域深耕近四十年。公司业务广泛,覆盖支付处理、免税退税及行业软件等,致力于通过一体化的解决方案提升全球商户的运营效率与顾客体验。

更高效的数据处理解决方案:基于 MinIO 部署 Apache Doris 存算分离版本实践

2025-10-30
阅读 6 分钟
872
现代数据处理在多维度面临严峻挑战,一方面,数据量的持续增长致使传统存储成本居高不下,非结构化数据所占比例日益攀升,进一步加重了存储负担,且数据质量问题推高了存储和清洗成本;另一方面,企业内部往往存在多套系统,数据难以集成,这对数据分析的成本和时效性也提出了更高的要求。
封面图

Apache Doris 数据导入原理与性能优化 | Deep Dive

2025-10-30
阅读 7 分钟
844
对于 Apache Doris 这样的高性能分析型数据库而言,高效、稳定的数据导入是保障实时分析能力的生命线。然而,在海量数据持续写入的场景下,如何平衡导入延迟与吞吐、如何避免性能瓶颈,是开发者面临的核心挑战。Apache Doris 本文将深入剖析 Doris 数据导入的核心原理,涵盖关键流程、组件、事务管理等,探讨影响导入性...
封面图

Apache Doris 4.0 版本正式发布:全面升级 AI 与搜索能力,强化离线计算

2025-10-29
阅读 24 分钟
1.1k
本次发布围绕 “AI 驱动、搜索增强、离线提效” 三大核心方向,新增向量索引、AI 函数等关键特性,完善搜索功能矩阵,优化离线计算稳定性与资源利用率,并通过多项底层改进提升查询性能与数据质量,为用户构建更高效、更灵活的企业级数据分析平台。