18

作者介绍

潘娟,京东数科高级DBA,Apache ShardingSphere PMC

张亮,京东数科数据研发负责人,Apache ShardingSphere VP,Apache Dubbo PMC,人气开源项目Elastic-Job作者

前序

从Sharding-JDBC到Apache ShardingSphere;
从轻量级的分库分表中间件到完整闭环的分布式数据库中间件平台;
从2016年1月的第一行代码到现今的300K+行代码;
从寥寥无几的关注到GitHub 10K+的star;
从无人问津的社区到100+位贡献者;
从公司内部的应用类库到100+的采用公司列表;
从寻找mentor到顺利成为Apache顶级项目。
……

Apache ShardingSphere团队核心初创人员将讲述这其中的跌宕起伏,并以时间轴为线索为你呈现它开源之路背后的故事。

项目介绍

Apache ShardingSphere是一套开源的分布式数据库中间件解决方案组成的生态圈,它由3款相互独立,却又能够混合部署配合使用的产品组成。它们均提供标准化的数据分片、分布式事务和数据库治理功能,可适用于如Java同构、异构语言、云原生等各种多样化的应用场景,核心功能如1-1所示。

image.png
1-1 ShardingSphere核心功能架构图

Apache ShardingSphere由三个子项目组成,形成一个完整的数据库解决方案,合称 J.P.S. 生态系统。

ShardingSphere-JDBC:定位为轻量级Java框架,在Java的JDBC层提供额外服务。 它使用客户端直连数据库,以jar包形式提供服务,无需额外部署和依赖,可理解为增强版的JDBC驱动,完全兼容JDBC和各种ORM框架。

ShardingSphere-Proxy:定位为透明化的数据库代理端,提供封装了数据库二进制协议的服务端版本,用于完成对异构语言的支持。 目前提供MySQL/PostgreSQL版本,它可以使用任何兼容MySQL/PostgreSQL协议的访问客户端操作数据,对DBA更加友好。

ShardingSphere-Sidecar(TODO):定位为Kubernetes的云原生数据库代理,以Sidecar的形式代理所有对数据库的访问。 通过无中心、零侵入的方案提供与数据库交互的的啮合层,即Database Mesh,又可称数据网格。

Apache ShardingSphere的亮点主要包括:

  1. 完整的分布式数据库解决方案:提供数据分片、分布式事务、数据弹性迁移、数据库和数据治理等核心能力。
  2. 独立的SQL解析引擎:支持多SQL方言的完全独立化SQL解析引擎,能够脱离ShardingSphere独立使用。
  3. 可插拔微内核:所有的SQL方言、数据库协议和功能都能够通过SPI的可插拔方式加载或卸载,微内核甚至在未来可以运行于无任何功能的空白环境中。

为Apache做准备

找寻mentor是进入Apache基金的最初且最重要的一步。在了解了Apache基金会的运作方式后,我们便踏上了找寻mentor之旅。参加各种与开源相关的分享会或meetup,借此来认识Apache的member。但是,事情却并不顺利。多次的尝试,多次的接触换来的只是口头的认可。这段时间我们确实倍感压力和焦虑,甚至打算以后再说,一切随缘。

后来一个契机,我们认识了吴晟和华为的姜宁。吴晟是Apache SkyWalking项目的VP,在开源领域有丰富的经验。他和ShardingSphere的前身Sharding-JDBC很有渊源,Sharding-JDBC项目原型也有他参与设计,因此,他最终作为ShardingSphere的PPMC一同建设社区。在参与ShardingSphere社区建设的这一年多的时间里,他又陆续担任了多个Apache孵化项目的Mentor,并在今年被选举为Apache Member;而姜宁同样是一位热心又有经验的老手,是国内最资深的Apache Member之一,在与他交流的过程中,终于让我们看到一些希望,他也最终成为了我们的mentor。再后来,团队VP张亮又前去上海参加HDC大会,认识了我们的另一位mentor—Craig L Russell,Craig当时是Apache的秘书长,所有的SGA、ICLA等法务文件均由他负责签署。在ShardingSphere孵化的过程中,Craig当选了Apache软件基金会的主席。他友善而和气,给予了我们很多有关社区规范的实用建议,也愿意助我们一臂之力;第三位mentor则是由Apache RocketMQ的核心成员冯嘉担任;最后由Roman Shaposhnik担任项目的Champion,为项目寻找导师之旅画上完美句号。

至今还记得我们当时的欣喜和激动。之前的无助、徘徊、失落在这一瞬间柳暗花明。每个进入Apache基金会的项目,一定都有自己的故事。尤其对于中国的项目来说,语言与地域的障碍让我们雪上加霜。好在有越来越多的来自于中国的项目进入了Apache基金会,也能看到越来越多的华人活跃在Apache的邮件列表里,还有ALC Beijing的建立让参与门槛不断降低,这对想要参与的国内朋友来说,确实是个good news!

进入Apache孵化器

为了正式进入Apache孵化器,项目代码、社区、文档等都需要进行一系列的规范和整理。这确实是个琐碎但很重要的事情。

代码层面,合规操作是首要原则。我们梳理第三方依赖的许可协议, 确保满足Apache软件许可协议(ASL)合规的要求;社区方面,我们开始由中文转变成英文;文档方面则需要我们准备英文文档,并准备相关的proposal。由于项目最开始的目标就是进入Apache基金会,所以在项目初期,依赖就尽可能地简单,社区相对规范,文档在不断翻译。不打无准备之仗,这些提前的准备让这部分工作进展顺利,而项目获得Apache域名的那一刻,大家才真切感受到所有付出得到了最有价值的回报。

除了学习写规范代码,团队成员也开始学习Apache的规范、运作方式、英文沟通渠道等细节。我们开始了解到如何关注社区,什么是consensus decision,如何用异步方式进行邮件沟通。特别是邮件列表的学习非常重要,你可以在其中找到历史问题记录、合规的解决方案、优秀的案例等。

Apache way的探索

很多人认为只要代码开放,就叫做开源。但其实,这仅仅只是开源旅程的第一步。如何构建一个活跃的社区,如何理解Apache way,是一个更为重要的话题。ShardingSphere在进入Apache孵化器初期并未能完全理解Apache way,并且由于过度注重代码风格,以至于参与门槛较高、社区活跃度平平。起初,我们并不知道问题出在哪里,迷茫了很长一段时间,直到在跟Apache的member不断交流的过程中才渐渐意识到问题所在,因此社区发起了有关committer bar的讨论,见图1-2。这是社区建设之路的转折点,因为从此community over code的理念开始逐渐渗入人心,并指导我们的行动。

image.png
1-2 Committer bar讨论邮件

仔细阅读Apache way的关注点:Earned Authority, Community of Peers, Open Communications, Consensus Decision Making, Responsible Oversight。你会发现它一直在强调合规、开放、平等、协作,为的就是建立合规且活跃的项目社区,尽可能地做到让更多的人参与,平等沟通,推动项目发展,促进个人成长。

秉持这个理念,ShardingSphere开始在多维度进行调整,

  • 代码:规整代码结构,划分模块功能,提供项目可插拔能力,从而允许用户局部参与某一模块的同时,尽量不破坏整体代码结构。
  • 心态:开放的心态,编制社区任务,鼓励社区朋友参与,相关PPMC或Committer积极提供指导和帮助。
  • 规范:梳理文档和代码规范,并提供详细的订阅、参与指南,大范围促进用户自主进行社区贡献。
  • 交流:鼓励社区尽可能使用邮件和Issue进行讨论从而公开讨论内容,同时针对较为细节的讨论则放在微信群里进行。此外,官方公众号还会介绍社区的进展、Release、刊登技术文章等。
  • 合作:与其他Apache社区建立联系、增加沟通,从合作交流中进行学习和发展。

在孵化期间,Apache ShardingSphere先后与Apache SkyWalking、Apache ServiceComb进行项目的合作与集成,不仅彼此的产品功能更加完善,还增加了社区成员之间的交流。此外,还与Apache DolphinScheduler(Incubating)和Apache IoTDB(Incubating)举办了co-meetup,详见图1-3。还与Apach pulsar和Apache APISIX(Incubating)的核心成员们进行了多次交流和探讨。

image.png
1-3 co-meetup

经过时间的积累,社区已有了质的变化。从社区的邮件讨论、GitHub的数据展示中,你会发现ShardingSphere的社区开始真正变得活跃与多元化。图1-4展示了ShardingSphere在Apache孵化器一年多的社区数据变化。

image.png
1-4 社区数据变化

社区与贡献者之间的依赖和互赢也在整个过程中体现的淋漓尽致。对于贡献者来说,他们会在这个开源社区中与其他人交流、协作。而这个持续的过程,将带来以下成果,

  • 扩大人际交友圈
  • 不断学习与成长
  • 提高自己的技术影响力
  • 拓宽职业渠道
  • 结合兴趣,享受过程

而对于社区来说,这个相互帮助和沟通的过程则会,

  • 拓展项目的功能
  • 收获活跃多元化的生态圈
  • 增加项目知名度
  • 获得社区的可持续发展

从这个角度来看,不断探索Apache way不也是希望出现这样一种共赢而互助的局面吗?Please remember community over code。

从孵化器毕业

所有孵化器的项目最终都希望能走向TLP(Top Level Project)。在mentor的指导、PPMC的探索、committer和contributor的支持与付出下,ShardingSphere开始筹备Apache孵化器毕业。依据Apache的成熟度评估模型图1-5,在以下几个方面评估社区和项目是否成熟。其实在Apache项目社区的初建阶段,我们建议大家就在这几个方面发力,因为这是官方给予的毕业标准及指导方针。以此为方向,探索属于各自项目的独特社区运作方式,也可谓是百花齐放。

image.png
1-5 Apache项目成熟度评估模型

经历Release、社区建设、Apache member的指导、meetup举办等一系列事件,ShardingSphere终于在社区发起了毕业讨论,开始接受Apache member及所有Apache成员的指导和评估。虽然最终以10 +1 binding votes,6 +1 non-binding votes和 no -1 or +/-0 votes通过毕业投票,但过程也是一波三折。

即便是经过1年多的社区建设,项目基本成熟,但面对毕业还是有很多工作要合乎毕业规范。例如确认商标是否可使用、完成项目官网有关Apache brand和trademark的陈述、网站符合Apache way等。在这个投票期间,由于官网存在fork me on github的slogan,而这一问题一直频繁出现并且没有结论,所以其他Apache成员借此单独开辟了thread来讨论这一问题,查看Email List了解详情。虽说这一举让ShardingSphere被成功推到前台,间接提高了项目的曝光,却也能看出Apache对于第三方独立、禁止参与商业行为的重视和严苛。可喜可贺的是,2020年4月16日,Apache ShardingSphere最终通过基金会董事会决议,加入了TLP行业!

未来的路

从Apache孵化器毕业成为TLP,对ShardingSphere来说,并不是一个结束,而是另一个开始。在产品功能上,ShardingSphere将继续在分布式数据库中间件平台上深耕,打磨出以“分布式”为核心的数据库中间件生态圈,从而提供完整的解决方案,如图1-6所示。从社区角度讲,ShardingSphere仍将继续活跃社区,鼓励更多朋友成为社区的committer和contributor。所以,我们欢迎大家关注ShardingSphere,并加入到社区来,与更多知己结伴前行。

image.png
1-6 Apache ShardingSphere生态圈

未来之路不可预测,但立足当下,眺望未来,初心未改,即便亦步亦趋,也愿一苇以航!

Apache ShardingSphere committer列表

Mentor

Craig L Russell
冯嘉,阿里巴巴
姜宁,华为

PMC

张亮,京东数科
潘娟,京东数科
赵俊,京东数科
张永伦,京东数科
陈清阳,翼支付
曹昊,海南新软
马晓光
杜红军,领创智信
杨翊,京东数科
吴晟,tetrate.io
高洪涛,tetrate.io

Committer

李亚,九个小海豹
颜志一,DaoCloud
董宗磊,京东零售
孙海生,瓜子
王奇,京东零售
欧阳文,一卡易
蒋晓峰,阿里巴巴
王光远
秦金卫,京东数科
岳令
赵亚楠

官网:https://shardingsphere.apache.org/

ShardingSphere
129 声望683 粉丝

Apache ShardingSphere 是一套开源的分布式数据库中间件解决方案组成的生态圈,它由Sharding-JDBC、Sharding-Proxy和Sharding-Sidecar(规划中)这3款相互独立,却又能够混合部署配合使用的产品组成。