1
头图

一年一度的国际妇女节到了,在为所有女性献上祝福的同时,也让我们聚焦那些在专业领域闪闪发光的女性领航者,向世界展现女性的智慧与力量。

在此,我们也隆重推出全新栏目“大咖讲堂”,邀请业内大咖分享他们对于科技发展的独到见解。第一期,我们邀请到了优秀的女性代表——亚马逊云科技Data Hero 潘娟,来为大家讲讲数据库领域的新趋势。

image.png

Q:数据库目前在云计算领域占领一个什么样的位置?有哪些应用场景?

A:无论是从公有云计算还是私有化部署领域来看,数据库始终都占有一个非常重要的位置。时至今日,企业的运转已经离不开数据的支撑,数据已经成为影响企业生产至关重要的因素。而为了保护这些重要的资产,就需要数据库承担起这样的角色。发展到今天,数据库所存储的也已经不单单是表面上的业务数据,其对于企业而言,隐含在数据深处的业务价值,正是数据库当下所存在的意义。

在云计算领域,因为『云』本身所具有的如弹性、按需分配、可运维性等特性,数据库作为软件基础设施中非常重要的角色,云上的环境、特性、资源等能力将支撑数据库将发挥出更大的价值。

至于应用场景,要从用户的应用场景去推导。因为所有数据库的诞生都是为了方便用户存储和使用数据的,在一些需要大型计算、大存储量的场景下,产生了 NewSQL 数据库,如亚马逊云科技的 Amazon Aurora;在一些面向 KV 存储、文件存储等场景下,产生了 NoSQL、MongoDB 等数据库产品。

除数据库本身之外,在数据库周边生态也存在着许多可开发的应用场景。特别是智能化运维方面,如 DevOps 等理念的落地实践等等。

image.png

Q:您研究的数据库领域技术主要有哪些?您希望这些研究能达到什么样的结果?

A:我目前主要从事的是分布式数据库领域方面的研究工作,在主导贡献 Apache 顶级开源项目 ShardingSphere 的同时,还担任了一家开源原生商业公司SphereEx 的 CTO。在我的规划里,开源项目与商业化走的是两条不同的发展路线:

开源部分,Apache ShardingSphere 将会遵循 Database Mesh 理念,在云端提供关于分布式数据库解决方案以及面向周边生态的数据服务;商业部分,SphereEx 未来将会提供更加完善的一体化分布式数据库或云数据库解决方案,并在面向 SphereEx 云数据库周边生态的管控、智能化运维等领域陆续推出一系列产品与服务。

未来,相信不只是数据库,整个社会与云的联系都将会更加紧密。SphereEx 与 Apache ShardingSphere 也在逐渐通过与云厂商进行深度绑定,持续在云平台上发挥更大的价值。目前 SphereEx 正在筹备加入亚马逊云科技的云创计划,联合亚马逊云科技共同为 ShardingSphere 提供公有云上的部署形式。后续,SphereEx 会在中国区和海外陆续在 Marketplace 与亚马逊云科技展开深度合作,为亚马逊云科技上的用户提供更加强大的 SaaS 产品部署能力,共同为企业应用打造更加成熟的云上环境。

image.png

Q:您在构建数据库时遇过哪些难点,并使用什么解决方案攻克了困难?

A:数据库本身的建设是非常复杂的,从根本上来说数据库的存在就是为了满足用户存储数据和查询数据的需求。为了达到这样的目标,整个数据库的研发需要一个非常强大的技术体系和严谨的理论支撑。

因此我们在思考关于数据库技术难点的同时,不能只是从技术的角度去看问题。一方面,研发团队需要向下持续深入建立关于数据库技术的体系,但另一方面也要考虑用户的实际需求,进而使数据库达到易用性与可用性的平衡。我们所要做的,也是比较难实现的,就是在这两者中找到平衡点。

在 Apache ShardingSphere 项目当中,团队完全独立研发了一套 SQL 语言--DistSQL,这是专门针对 SphereEx 和 Apache ShardingSphere 而设计的一套数据库方言。就像人类交流有不同的语言一样,数据库也是如此,不同的数据库有着各自独具特色的方言。尤其是随着分布式数据库的流行,传统 SQL 无法支持分布式场景下的部分能力。因此我们希望在提供 Apache ShardingSphere 分布式数据库解决方案生态的同时,提供方便用户使用这套数据库解决方案的手段,即 DistSQL。通过 DistSQL,用户可以直接操作传统数据库额外分布式场景下如数据加解密、高可用、弹性扩缩容等能力。Apache ShardingSphere 通过 DistSQL,以一种标准化的方式简化了用户的使用步骤,对终端用户屏蔽了复杂的实现过程。

image.png

Q:数据库领域现在还有哪些最新令人兴奋的技术?这些技术革新对业内甚至对日常生活会产生什么样的影响?

A:数据库作为一款底层基础设施平台,对于用户而言,很难在日常生活中直接感知到底层数据库所带来的变化,通常都是通过某些特殊事件间接体验到数据库领域的技术进步对日常生活的影响。最典型的就是黑五、11.11和 6.18 这种电商大促场景。对于消费者用户而言,需要的只是手速,但在后端运维同学看来,这就是一次对于本身技术、数据库性能的大考。随着技术愈发成熟,近年来已经很难看到大促期间因流量过大导致业务不可用的情况发生。数据库在背后默默支撑上层的应用与服务,保证业务在某个关键节点的可用性,为所有用户带来全程的顺畅体验,这就是技术革新对生活所带来的影响。

随着各领域对于数据库的需求不断上涨,截然不同的用户场景催生了各类专注各自细分领域的数据库,如 NoSQL、NewSQL、云数据库,以及一些专注行业细分场景下的数据库。目前,数据库领域已经呈现出非常明显的碎片化态势。因此在不同的领域下,数据库的发展方向自然也是不同的。包括如何实现数据库智能化运维,如何将数据库与 AI、云计算联系起来,如何让各个互联网基础设施在数据库层面上产生融合,这些都是大家在挖掘的方向。

作为 SphereEx 公司的联合创始人,我对于行业趋势的感受是比较深的,随着数据库周边生态的完善,自动化运维、智能运维理念的推广,一些传统运维模式正在逐渐被边缘化。因此数据库运维同学可以将视野聚焦在数据库场景中,因为数据库是一个非常有潜力的领域,但不能只是把目光局限于目前的工作。为了未来的事业规划,运维同学所需要做的是提升自身的不可替代性,让自己永远跑在体系的前面。

image.png

Q:数据库在云计算领域未来的发展趋势如何?

A:毫无疑问,数据库与云计算的结合是未来的大势所趋。SphereEx 自然也希望在未来能够加紧与云厂商在这方面的合作,在云上面向用户提供 SaaS、PaaS 层面的支撑。因为本身云计算弹性扩缩容、可运维性、易操作性以及按需分配等等特性,对于基础设施服务而言都是非常友好的。数据库作为新时代基础设施中国非常重要的一部分,通过与云相关的技术产生结合,不论是数据库厂商、云厂商还是用户,三者之间的联系只会越来越紧密。

Q:对于想要进入或者已经在数据库领域的构建者有什么技能提升的经验分享?

A:主要有两点,分别是关于职业规划和技能提升。

在职业规划方面,我始终秉承着一句话『选择大于努力』。如果选择了错误方向,并且继续在错误的方向拼命奔跑,这是最没有效率的一种方式。所以为了避免这种情况的出现,大家一定要关注整个行业的发展,关注云、数据库领域的发展。选对了方向,比在反方向上奔跑,要有益的多。推荐大家可以多关注云厂商的资讯,如发布新产品、招聘计划等,这样能够帮助你快速了解到当前业界的风向。站在了风口,才能得到更快的成长。

在技能提升方面,我非常鼓励大家参与到开源社区里来。从开源文化产生到今天,参与开源对于大多数人而言都是一个获得技术提升的绝佳途径。当你了解到开源并深度参与进去的时候,你一定是可以从实操层面感受到技术的变化,而这种来自感知层面的变化,将会从意识层面帮助你主动接纳新技能。


亚马逊云开发者
2.9k 声望9.6k 粉丝

亚马逊云开发者社区是面向开发者交流与互动的平台。在这里,你可以分享和获取有关云计算、人工智能、IoT、区块链等相关技术和前沿知识,也可以与同行或爱好者们交流探讨,共同成长。