头图
以下内容是根据玖章算术CEO叶正盛在「3306π 数据库朋友圈」技术演讲整理。文末附完整的PPT下载链接!

MySQL与PostgreSQL都是非常优秀并且非常成功的数据库,PostgreSQL的功能比MySQL强大,但是依然没有MySQL流行,作者从产品功能、技术架构、生态、品牌商业几方面来分析原因。

影响产品发展的因素

根据搜索引擎指数统计,过去1年Google Trends(全球)显示MySQL关键字网页搜索是PostgreSQL的1.5倍,百度指数(中国)显示MySQL是PostgreSQL的4.2倍。

根据云厂商调研数据,全球MySQL用量大概是PostgreSQL的3倍,中国大概是15倍(备注,云厂商数据统计口径比较多,仅供参考)。

DB-Engines从2013年开始对全球数据库流行度做跟踪,每个月从搜索引擎(Google)、社区问答(Stack overflow,DBA Stack Exchange)、企业招聘岗位(Indeed,Simply hired)、个人资料(Linkedin)、社区话题(Twitter)等渠道采集数据并做加权计分,在行业里有很高权威性。从2023年9月份的数据看,MySQL以1111分排名第2,PostgreSQL以621分排名第4。

1、PostgreSQL没有MySQL流行的10个原因

综合来看,MySQL比PostgreSQL都具有更高的流行度,但是PostgreSQL在产品功能方面是公认的开源领域No.1。为什么功能强大的PostgreSQL没有MySQL流行,作者总结了以下10个原因。

(总结)功能强大的PostgreSQL没有MysQL流行的10个原因

从产品功能分析,虽然MySQL没有PostgreSQL功能强大,但是MySQL基于线程模型+读写分离方案,在早期互联网兴起时LAMP(Linux+Apache+MySQL+PHP)是非常流行的解决方案。早期(2000~2010)MySQL更多使用在新闻、论坛等互联网场景,随着InnoDB存储引擎的成熟,MySQL在事务处理方面也全面增强,开始在互联网交易领域全面开花,如阿里巴巴使用MySQL全面完成了去IOE,京东、携程也从Oracle/SQLServer转到了分布式MySQL架构。PostgreSQL因为是进程模型,与PHP这类没有内置连接池的语言较难配合,在高并发的互联网场景不如MySQL有扩展优势,并且大型互联网公司在分库分表后SQL语句普遍较简单,PostgreSQL不能体现出竞争力。

从公司和品牌观察,MySQL长期有主体公司(MySQL AB/SUN/Oracle)推动,并且基于GPL开源协议(GPL主旨是第三方如果修改源码再发布需要回馈到主干或者开源),可以更好聚合社区回馈形成品牌效应,PostgreSQL的没有绝对的主体商业公司驱动,加上宽松的类BSD/MIT协议,PostgreSQL有很多分支,功能并没有回馈到主干,导致社区品牌效应没有MySQL聚力。

MySQL的易用性非常好,出生就支持Windows/Linux,MySQL的小巧灵活,简单易用(limit分页、show语法等等),获得了很多开发者的喜爱,容易形成人才优势,人才技能会很大影响着软件架构选型。PostgreSQL早期只支持Linux,直到8.0才支持Windows,它在代码结构与数据库标准实现方面是典范,是学术领域的最爱,但是学术研究相比工业应用的人群少很多,实践成功案例不如MySQL丰富。

MySQL在中国流行度是全球最高,很大原因来自于新浪、网易、搜狐、百度、腾讯等公司早期使用PHP+MySQL的实践,再加上阿里巴巴成功通过Java+MySQL完成去IOE的标杆案例,让MySQL在中国全面压倒性超越PostgreSQL。题外话:MySQL在英文含义与发音方面相比PostgreSQL简洁,对于大众品牌心智来说有些许优势。

数据库是非常核心的基础软件,生产使用后替换的成本很高,即使现在看PostgreSQL在功能上更领先,但是在稳定性方面没有得到大规模的验证、人才储备不足的情况下,要替换现有系统是高风险的事情。Uber曾经就因为使用PostgreSQL遇到很多问题,然后全部迁移到MySQL。

2、数据库在主要业务场景的竞争力分析和展望

数据库在主要业务场景竞争力

在互联网领域,MySQL有绝对的影响力,但是我们也看到PostgreSQL在GIS(地理信息系统)领域非常强大,PostGIS是PostgreSQL面向GIS领域的专业插件,几乎成为GIS领域的标准解决方案。

市场需求与趋势(国内)

PostgreSQL已经错失了互联网机遇,不过它支持更复杂的SQL,HTAP能力也更加出色,适合应用于企业级软件领域(ERP、CRM、BOSS等等)。但随着中国的信创产业发展迅速,PostgreSQL宽松的BSD开源协议,很多厂商基于PostgreSQL发展出了新型国产数据库,提供更好的服务支持,信创涉及到大量系统替换,这可能会是PostgreSQL在中国迎来新的发展机会。另外PostgreSQL的pgVector插件可以支持基础的向量数据库功能,在赶上了今天ChatGPT引领的大模型AI时代风口。

产品与技术总是在不停的进步,MySQL与PostgreSQL的选型还会是持续争论的话题,MySQL依靠互联网有先发优势,并且人才丰富,当前在互联网领域还会是首选,但是由于MySQL对复杂SQL支持不足,在企业级软件领域PostgreSQL会更有后劲。虽然国内Oracle、DB2这些企业级数据库都将远去,但是我们看见达梦、OceanBase等自研数据库在飞速发展,PostgreSQL还会面临新一轮的竞争。

本文更多是作者的经验总结与思考,也查阅了大量的资料,以下是部分参考资料:

3、作者简介

叶正盛,玖章算术CEO,NineData程序员(https://www.ninedata.cloud/),原阿里云数据库产品管理与解决方案部总经理,资深技术专家,是阿里巴巴去IOE、异地多活、云原生数据库等项目核心成员。

▶︎ 附注2个数据库分类和市场大图

数据库系统分类大图

国内数据库市场特征大图

如要下载完整的PPT,请关注NineData公众号,回复「NineData」,直接领取。


NineData
3 声望2 粉丝

NineData是云原生智能数据管理平台,包含SQL开发、数据复制、备份和对比等,轻松完成数据上云、传输、ETL、备份、SQL开发、数据库研发规范、生产变更和敏感数据管理,致力于让每人用好数据和云。