为了帮助大家及时了解中国数据库行业发展现状、梳理当前数据库市场环境和产品生态等情况,从2022年4月起,墨天轮社区行业分析研究团队出品将持续每月为大家推出最新中国数据库行业分析报告持续传播数据技术知识、努力促进技术创新与行业生态发展,目前已更至第十期,并发布了共计127页的2022年度分析报告

2月《中国数据库行业分析报告》已正式发布(点击即可跳转,欢迎大家下载查阅),本期报告盘点了墨天轮“中国数据库流行度排行”、产品发布、数据库中标等业内最新资讯,以此呈现当前数据库市场发展前沿动态。

本月报告重点介绍了数据库架构如何从OLTP、OLAP到NewSQL、HTAP、LakeHouse再到超融合数据库的演进历程,及不同架构的技术特性,并详解多模数据库的技术原理与发展趋势。最后,精选展示了几则国内典型的超融合数据库、多模数据库产品的架构特性与应用场景。

一、数据库排行榜及行业前沿

本章节目录👆

  • 2月中国数据库流行度排名分析

2023年2月的墨天轮中国数据库流行度排行榜共259个数据库参与排名,榜单前十用一句话可以概括为:人大金仓上升两名排名有突破,AnalyticDB 进军榜单第九,OTO组合稳健开局。OceanBase 连续三月问鼎榜首,给年度榜首之主带来了悬念。排行榜前四获得者较上月虽未发生变化,但是各厂商之间的得分差距有所拉大,尤其是前三中第二名与第三名之间的得分差距达到了77.62分。此外,人大金仓、AnalyticDB 强势来袭,给后续榜单各产品的排名带来了更多可能性。


此外,2月榜单中有众多数据库排名有了质的飞跃,他们主要集中于关系型数据库领域,在各自的细分领域崭露头角。诸如神舟通用提升了13个位次至第16位,这也是其自2022年5月以来,拥有的最优地位;星环科技的 KunDB本月排名较上月上升5位至第23名;飞轮科技的 SelectDB 排名较上月提升35位,现已至第30位等。

  • 数据库行业发展动态

行业年度盘点层面,2023年1月起,墨天轮陆续发布了2022年度中国数据库墨力象限2022年度数据库获奖名单,期望能够对2022年各产品的表现进行客观总结,并从多维度呈现出中国数据库产业发展的全貌。此外,《2022年墨天轮数据库大调查报告》已正式发布,该报告基于3476份有效问卷结果分析形成,旨在全面深入地了解数据库行业以及从业人员的现状、数据库选型、中国数据库的发展趋势等,是各相关政府部门以及行业了解数据库从业人员以及数据库行业的重要参考资料。1月19日,中国计算机学会(CCF)发布“ 2022年度CCF科学技术奖”,中国人民大学王珊教授、OceanBase首席科学家阳振坤以及openGauss分别荣获奖项。

 

市场动态层面,报告整理了2022年12月至今国产数据库行业的中标情况,并汇总为一览表;同时梳理了数据库相关上市公司2022年财报表格。产品发布层面,TiDB 推出创新的 AI 支持的 SQL 生成器——Chat2Query,可实现更快的洞察力;浪潮集团控股的 KaiwuDB 正式推出1.0 时序数据库版本;星环科技正式发布分布式图数据库 StellarDB 4.1版本。此处篇幅所限未展现所有截图,报告中均对其架构、特性进行了梳理呈现。

 

二、超融合数据库架构解析

本章节目录👆

  • 数据库架构发展史及现状剖析

自1970年以来,数据架构库技术不断演进,先后有OLTP(交易型数据库)、OLAP(分析型数据库)、大数据/数据湖、NewSQL、HTAP、LakeHouse以及目前的超融合架构出现。报告第二章开篇,则为大家梳理了数据库架构的演进历程及当前所面临的问题与挑战

 

当前数据中心部署的四大类产品之间需要频繁的数据搬运,整个技术栈非常复杂,由此带来了诸多问题和挑战,由此便产生了融合各种技术的数据库产品。

  • 三大融合架构:NewSQL、HTAP、数据湖

报告选取了三大当前盛行的两两融合的数据库架构——NewSQL、HTAP、数据湖,介绍其技术特性与优缺点。此处仅罗列简要观点,具体内容可查阅报告

其中,NewSQL为OLTP和大数据的融合,相比传统数据库都是以磁盘为存储中心的架构,NewSQL使用纯内存操作,读取和写入数据速度较快;用户可以按需使用、数据库本身可能使用云产品,例如云存储等,可以较容易的实现可扩展性。但也存在冲突检测互斥粒度过大、极致的水平写扩展能力有限、潜在厂商绑定风险等缺点。

HTAP是混合事务分析型数据库,是OLTP+OLAP的融合。通过行列存储、大规模并行处理技术、资源隔离等核心技术实现同时满足事务类、分析类的业务需求,可按需扩展吞吐或存储,轻松应对高并发、海量数据场景。但其系统也具有一定的复杂性,对安全性需求较大的同时对使用者技术水平要求较高。

数据湖是统一存储池,可对接多种数据输入方式,存储任意规模的结构化、半结构化、非结构化数据。当前已经经历了以Hadoop为代表的离线数据处理基础设施到Lambda架构再到Kappa架构的技术架构演进。

  • 未来趋势:超融合数据库

超融合架构的核心是模块化和插件化。通过插件化可以为不同的场景提供支持。譬如存储器可以使用行存模块支持OLTP而使用列存支持OLAP。超融合数据库是技术发展的自然走向,从下图可以看出这一趋势:从两两融合走向超融合

超融合数据库是指融合交易型数据库(OLTP)、分析型数据库(OLAP)和大数据/数据湖的一种数据库技术,其能够在统一平台下、在全量全域数据范畴内,实现多模数据融通+ 基于SQL等通用语言的全场景查询分析+高性能与易用性。报告中详细介绍了超融合数据库的核心技术、原理与发展现状、问题挑战与应用场景。可以发现,超融合数据库可以很好地解决此前四大类产品之间频繁进行数据搬运导致的复杂低效、代价高昂等问题,简洁而优雅。不过,在其发展过程中也面临存储扩展性受限、数据安全等问题和挑战,篇幅所限此处仅展示部分截图,具体可查阅报告

 

三、多模数据库技术的概述

本章节目录👆

当前,围绕多种数据类型的存储与处理需求,业内也通过搭建涉及多种不同的数据库技术的混合架构来解决各种不同的数据问题。但是随着新基建的到来以及5G带来的应用爆发、数据爆发,可能会有更多模式的数据库种类出现,多模数据库则将成为业内一大研究发展趋势。本章节则围绕多模数据库的技术原理、发展背景以及优劣势等特征进行了论述,并总结其发展历程、国内外发展现状与发展趋势,望对业内研究发展提供参考。

多模数据库是指能够支持处理多种数据模式混合的数据库(例如关系、KV、文档、图、时序等)多模数据库支持灵活的数据存储类型,将各种类型的数据进行集中存储、查询和处理,可以同时满足应用程序对于结构化、半结构化和非结构化数据的统一管理需求。未来多模数据库应该是一种原生支持各种数据模型,有着统一访问接口,能自动化管理各模型的数据转化,模式进化且避免数据冗余的新型数据库系统。未来,多模数据库可以从原子性、用于恢复和来源的故障弹性、遥感勘测、机器学习等四个方面发展。此处因篇幅所限仅展示部分观点,具体内容可查阅报告

 

报告的最后选取了几款国内超融合数据库和多模数据库的案例进行了展示,诸如YMatrix发布的MatrixDB,其是全球首款同时支持OLTP、OLAP和物联网时序应用的超融合型分布式数据库产品;亚信科技发布的AntDB V7.2数据库,具备超融合一体化流式引擎能力,能够满足用户在 HTAP、湖仓一体、流式一体等多方面的混合负载需求;矩阵起源发布的超融合异构云原生数据库MatrixOne,可同时支持OLTP、OLAP和流式工作(Streaming)负载;云和恩墨在在openGauss内核基础上开发的超融合时序数据库Uqbar,同时支持关系模型和时序模型,是一款专为物联网场景设计的数据处理平台;星环科技自主研发的一站式分析型分布式多模数据库Transwarp ArgoDB,可以替代Hadoop+MPP混合架构;阿里云自研面向物联网、互联网、车联网等设计和优化的云原生多模超融合数据库Lindorm;华为云自研的全分布式架构多模NoSQL数据库GaussDB NoSQL,支持四种数据模型文档、宽列、时序。欢迎各位朋友查阅报告了解其实现原理与技术价值。此处仅展示其中几张内容,大家可以下载报告获取更多内容。


本文仅对2月《中国数据库行业分析报告》的部分内容进行了摘录、整理,更多完整、详细内容大家可以下载报告全文了解,也欢迎各位数据行业同道交流、讨论、建言献策,我们一同见证、共同助力中国数据库产业的发展壮大!

报告全文下载地址:https://www.modb.pro/doc/98495

往期报告下载


更多精彩内容尽在墨天轮技术社区,围绕数据人的学习成长提供一站式的全面服务,持续促进数据领域的知识传播和技术创新。添加社区墨天轮小助手(VX:modb666)可以获取更多技术干货。

3月2日,社区将围绕本期报告“超融合及多模数据库技术”主题举办【2023数据技术嘉年华·ON LINE (第一期)】直播活动,邀请到了湖南亚信、云和恩墨、星环科技、矩阵起源等行业优秀的数据库厂商进行分享,诚邀各位朋友参与!
点击即可报名:https://www.modb.pro/event/787


墨天轮
30 声望18 粉丝