6

clipboard.png
《IT国产化特别策划》之数据库篇
作者:徐九丨发布自:思否编辑部


引言:

数据库作为中国技术科技发展的 35 项“卡脖子”技术之一,长期以来被 Oracle、IBM、微软等美国巨头占据。在中美贸易战及云计算等新技术变革背景下,国产数据库的发展在近一两年备受瞩目。

而这几年国产数据库的进步也是有目共睹的,尤其是随着国内移动互联网的迅猛发展,给很多国产新型数据库的应用创造了全球独一无二的场景,也被称为是我国最容易实现弯道超车的一项技术。

那么国产数据库发展现状如何?技术方面有了哪些突破?又存在哪些问题、面临哪些挑战?

一、国产数据库的现状

clipboard.png
图片来源:老鱼笔记

国产数据库的发展最初源于国家的引导、支持和扶植,在最开始的阶段,国产数据库的研发始于高校,而随着互联网的发展,互联网企业以及越来越多的创业企业纷纷也参与到了数据库的建设中来,让国产数据库进入到了一个百花齐放、百家争鸣的时代。

按照主流的分类方式,国产数据库目前主要分为三种:

1、传统国产数据库

我们刚才说到,国产数据库的研发始于高校,这一批中发展最好的几家分别是人大金仓、武汉达梦、神州通用、南大通用,被称为国产数据库四小龙。

这几大数据库公司直到现在仍然是国产数据库的重要参与力量,也属于国产数据库领域的“国家队”。

1)人大金仓

人大金仓成立于 1999 年,其企业级通用数据库 KingbaseES 是入选国家自主创新产品目录的唯一数据库软件产品,也是国家级、省部级实际项目中应用最广泛的国产数据库产品。

2) 武汉达梦

武汉达梦成立于 2000 年,其前身是华中科技大学数据库与多媒体研究所。目前主要应用于我国国防军事、公安、电力、电信、审计、交通、电子政务、税务、国土资源、制造业、消防、电子商务等20多个行业及领域,装机量超过10万套。

3) 神州通用

神舟通用是国家“核高基”重大科技项目之数据库产品的核心研制单位,通过了国家软件企业认证资格、高新技术企业认证、ISO9001认证、涉及国家秘密的计算机信息系统集成资质认证。目前与浙江大学、北航、北京大学、中科院软件所等高校和科研院所均开展了深度合作。

4) 南大通用

南大通用成立于2004年,是南开大学下属天津南开创元信息技术有限公司的控股子公司。南大通用的核心竞争力是数据处理以及数据安全技术,不断开发科技含量高、附加值较大、市场急需的具有自主品牌的软件产品,为我国电子政务、电子商务、信息安全等领域提供基础产品支撑和专业服务。

2、头部科技企业数据库产品

虽然数据库是一项需要时间沉淀的技术,但大部分传统的数据库基本都是基于几十年前传统的技术架构设计,随着互联网和大数据的发展,很多已经不再适应现在更复杂的应用需求和更新、更强大的硬件环境,这也让一些头部的互联网公司和云技术厂商顺势跻身进入了这一战场。

这其中,阿里巴巴的OceanBase、PolarDB,腾讯的 TDSQL、TBase等,华为的 GaussDB,都凭借着自身的云平台,开始布局数据库市场;

除了云厂商外,很多传统的头部科技企业也参与到了数据库的核心技术攻关中,这其中就包括中兴、浪潮等。中兴推出了 GoldenDB,而浪潮则是推出了K-DB。

另外,很多大型国企数据库公司,比如:中国移动、国家电网等巨头公司,也都成立了数据库产品公司研究开源数据库如何支撑内部业务系统。

3、新兴独立数据库创业产品

当然,既然国产数据库进入到了一个百花齐放、百家争鸣的时代,那么就不存在一个数据库通吃的情况。不同的场景需要不同类型的数据库产品,来满足特定的场景需求,这也给了很多新兴的独立数据库创业企业以发展机会。

在2011年之后,我国涌现出了很多新兴的数据库公司,以下为墨天轮发布的2020年国产数据库名录:

clipboard.png
clipboard.png

从名单可以看出,我国的国产数据库产品类型多样,正在逐渐形成一个成熟、全面的数据库生态。很多新兴的独立数据库创业企业,也已经取得了很不错的成绩。

PingCAP 是国内开源的新型分布式数据库公司,公司旗下的产品 TiDB 是目前国内最火的分布式 HTAP 数据库之一。自称“TiDB 亲爹之一”的黄东旭,是一名受到开源文化和自由软件运动的影响很深的开源信徒,这也让 TiDB 通过开源方式获取全球用户的信任,可能是在国际上影响力最大的国产开源数据库。

时序数据库 TDengine 1.0 版本在开源后,连续一周都排在 GitHub 全球趋势榜第一,两个月内便拿到 10000 个 star。从性能方面来看,单纯从写入速度上考虑,在多客户端连接同步写入的速度 TDengine 远远高于同等条件下的 MySQL, Cassandra, InfluxDB 和 Open TSDB 以及 ClickHouse,是 Open TSDB 和 MySQL 最大写入速度的 150 倍。

巨杉数据库 SequoiaDB 则定位于金融级分布式数据库,自 2011 年起自研原生分布式引擎,基于计算存储分离架构,提供 I/O 互不干扰 HTAP 能力,已连续三年入选 Gartner 数据库报告。独特的引擎级多模设计,基于同一份数据可支持MySQL、PostgreSQL、MongoDB、SparkSQL兼容协议的跨引擎事务一致性。

还有很多优秀的企业和产品我们无法一一举例,但毫无疑问,目前国产数据库处在发展最佳时机,创新的商业模式以及丰富的应用场景推动了数据库进入百家争鸣的时代。

二、国产数据库的技术发展

技术领域是非常容易形成垄断的。目前,国外商业数据库如 Oracle 等在国内市场占据着极高的市场份额,国产数据库可能仍然不到 10% 的份额。

我们必须承认,目前数据库产品与国外标杆数据库的差距依然较大,但近几年也不断的发展迭代,并在这个过程中取得了一定的成绩:

  • 2018 年 5 月,星环通过 TPC-DS,这是国产数据库首破 OLAP 的 benchmark 世界纪录。2019 年初,阿里云 AnalyticDB 也通过 TPC-DS;
  • 2019 年 5 月,华为正式面向全球推出了 GaussDB 数据库,其 GaussDB OLTP 数据库已在招商银行综合支付交易系统和工商银行内成功上线投产;
  • 2019 年 8 月,腾讯云发布 CynosDB 商业化版本,智能数据库诊断系统 DBbrain。11月,宣布开源 TBase 数据库,TDSQL 数据库落地张家港农商银行新一代核心业务系统;
  • 2019 年 9 月,华为云在 HC 大会上发布了 GeminiDB、TaurusDB 和 GaussDB OLTP 上云;
  • 2019 年 9 月,阿里云推出 POLARDB Box,这是业内首次推出基于云原生数据库的一体机。11 月,Gartner 公布 2019 年全球数据库魔力象限评选结果,阿里云进入“挑战者”象限,并连续两年作为唯一的中国企业进入该榜单;
  • 2019 年 10 月,蚂蚁金服 OceanBase 登顶 TPC-C,这是国产数据库首破 OLTP 的 benchmark 世界纪录;
  • 2019 年 10 月,中兴 GoldenDB 成功帮助中信银行替换 DB2,换“心”后的中信银行信用卡核心交易系统对外投产,这是全国性股份制商业银行的首例;
  • 2019 年 10 月,巨杉数据库作为唯一中国企业入围 Gartner Peer Insights 2019 年度评选,并位居第三。11 月,连续第三年入选 Gartne r数据库推荐报告;
  • 2020 年 05 月,TPC 官网公布,由蚂蚁金服自主研发的分布式关系数据库OceanBase,在 TPC-C 基准测试中打破由自己保持的世界纪录;
  • 2020 年 5月,全国人大代表、合肥工业大学应用数学研究所所长檀结庆,对于数据库领域的国产化提出了建议,他呼吁扩大国产数据库金融领域试点。还援引易鲸捷贵阳银行与贵阳农商银行核心交易系统数据库国产化试点项目;
  • 2020 年 6 月,华为兑现了去年 HDC 大会上的承诺,openGauss 终于正式亮相,源代码开放、社区成立。

毫无疑问,过去的一两年中,无论是技术的创新迭代还是在世界级舞台上的发声,国产数据库都取得了具有里程碑意义的进展,甚至有媒体宣称“国产数据库们的春天来了”。

不可否认,国产数据化进入了一个飞速发展的时代,但数据库产品的研发是一个大投入,长周期,对技术要求很高的领域。我国的数据库行业虽然上了发展的快车道,但仍存在很多客观的问题,亟待解决。

三、国产数据库存在的客观问题

华东师范大学副校长周傲英教授在谈及中国数据库发展时,曾经这样说道:

数据库一直都是中国的切肤之痛,从六五(指第六个五年计划)开始,我们就在立项,我们要做自己的数据库,但我们一直没有弄明白,为什么我们做不出来自己的数据库,后来到了互联网时代,我们一下子醒悟过来了,就是生态。

这之中既包含用户生态,更包含技术生态,前者是我们要将国内数据库市场空间做大,后者是我们要形成合力,因为数据库要解决的问题是综合性的,只有一起才能将这个事情做好。

虽然,国产数据库取得了极为耀眼的成绩,但这并不代表国产数据库就很完美,一些亟待解决的问题依然存在。

从用户的角度看国产数据库,主要存在几个方面的问题:

  • 行业标准
  • 产品生态
  • 技术硬实力

首先,是标准问题。百家争鸣、百花齐放是一件好事,但在一项技术的发展初期则也代表着统一标准的缺失。那么多的数据库产品,我要如何做选择?在现阶段来说并没有一个客观的评判标准。此外行业也没有一套成熟的服务体系,应急处理和售后方面作为服务商仍有很多的提高空间。

其次,是产品的生态问题。国产数据库除了追求技术迭代外,也应该关注产品的生态发展。与周边上下游产品的兼容性、配套软件&工具支持、开发者关系等等,都是一项产品能最终获得市场份额的重要因素。大部分国产数据库目前主要的关注点,仍在于相关产品本身,还未来得及开始关注产品生态和用户生态的建设。

最后,是技术硬实力的问题。目前国产的关系型数据库,大部分源自或者借鉴开源 MySQL、PostgreSQL 数据库及其变种,或收购商业源码(例如Informix)+自研的方式;大数据平台,多源自或直接整合开源大数据生态组件;纯自研的国产数据库还是少数,数据库种类不够丰富,尤其 NoSQL 这块。数据库是应用软件的核心,发展技术硬实力才是硬道理。

最后

标题写到《国产数据库,不存在“赢家通吃”》,现阶段其实可以拆开来解读 —— 即不存在赢家,也不存在通吃。国产数据库要的不是跑赢友商,而是要发挥各自的特点和优势,争取早日在全球市场占有一席之地。

而每一位数据库领域的开发者和从业者,都将成为推动国内数据库产品发展的中坚力量,让国产化走的更好、更稳、更快一点。用 TiDB 设计者黄东旭老师的一句话来做本文的结尾:

“我的一个人生理念,就是没有解决不了的问题。我相信这个世界是在往好的方向发展,而我也真的可以让这个世界不断变得更好一点。”

部分参考资料:

1.老鱼笔记:《盘点2019:对国产数据库的一点观察和总结》
2.墨天轮:《2020 :国产数据库名录和产品信息一览》
3.汉理资本:《国产数据库行业研究报告》
4.电子商务世界:《国产数据库产业发展思索》
5.软件和集成电路:《国产数据库发展之路》
6.信息安全研究:《数据库国产化替代面临的问题及对策研究》


拓展阅读:

1.2020,IT国产化剑指何方|国庆特别专题
2.如何在Windows和macOS两大巨头压力下脱颖而出 | IT国产化国庆特别专题

clipboard.png


阿遂
10k 声望906 粉丝

老编辑,深夜撰稿者。