头图

从北京时间4月5号起,研发管理协同领域的海外标杆公司 Atlassian 的 Cloud 版本发生宕机事故,导致 Jira、Confluence 在内的至少7款产品无法访问。Atlassian 目前市值不到700亿美元,年营业额超25亿美元,其中最大收入来源就是项目管理和知识库管理组合「Jira + Confluence 」。

image.png

根据 Atlassian 官方透露,此次宕机事故影响了全球约400家企业客户,截止4月13日,宕机已持续9天,故障仍未完全被修复。
这一「旷日持久」的宕机事件,再次引发了业界对于上云如何保障数据安全的话题。

事故之谜

宕机事故发生48小时后,多名用户表示难以联系到官方获得支持,部分得到官方回复的也只是告知「问题仍需几天修复」。

事故发生2天后的4月7日,Atlassian 在其 Twitter 账号简述了事故原因:「在执行例行维护脚本时,少数网站无意中被禁用,导致他们无法访问其产品和数据。」

同时,官方表示已投入大量工程师7/24全天候致力于修复此问题,并将在修复完成后,出具详细的事后分析报告。

此次事故将带来哪些具体影响,需要在日后一一计算。但数据安全显然已经成为了众多客户最担忧的事情。

官方账号 @Ask Atlassian 在 Twitter 中的一项声明似乎表明了此次事件将可能造成部分客户的数据丢失,引发了大量客户的讨论与担忧。4月8日,海外 IT 新闻媒体 TechTarget 在一则新闻中也指出,有客户质疑了官方的事故原因,因为按照官方给的说法,是不需要这么长时间、投入这么多人力进行修复的。

image.png

接着,4月12日,Atlassian 官方发布通知,目前已帮助45%的客户完成站点重建。然而由于重建工作的复杂性,他们预计还需要2周的时间才能完成所有的重建工作。

image.png

其实,早在4月6日停服超过24小时的时候,Atlassian 已经违反了「服务水平协议」(SLA, Service Level Agreement)。根据该协议,Atlassian 云产品的每月正常运行时间应在99.9%(Premium)或99.95%(Enterprise)以上,即停机时间不能超过45分钟/月。

而今,事故已经持续9天甚至更久,远远超过了 Atlassian 在协议中承诺的停机时间。
去年10月底,Atlassian 市值最高曾超1200亿美元,其后股价一直下滑,今年3月初相比去年11月,市值已经「腰斩」。截止4月11日,其市值为688.55亿美元。此次事故对其股价持续下跌的趋势或许是「雪上加霜」。

尽管此次事故原因和影响还有待进一步调查和核算,但业界的焦点一致指向了「上云如何保障数据安全」这个话题。

安全!安全!

Atlassian 云版本宕机事故在整个云计算行业并不罕见。实际上,在过去的几年里,国内外的云服务厂商、SaaS 软件厂商宕机事故频发

2010年至2019年间,AWS 平均每年宕机次数达2.4次。而仅在2021年12月,AWS 就连续发生了3次宕机。IBM Cloud 在2021年5月,5天内发生2次宕机事件;Google Cloud 于2021年发生2次宕机;Microsoft Azure 于2021年10月发生长达6小时的宕机。

国内外 SaaS 厂商同样发生了几次严重宕机事故。2021年,SaaS 鼻祖 Salesforce 因为一位运维工程师未遵守规范,企图走捷径修 Bug 而造成了长达5小时的全球宕机,使15万客户的 CRM 系统陷入瘫痪。在国内,2020年的微盟程序员删库跑路事件也导致了300万余用户无法正常使用该公司的 SaaS 产品,给公司造成了近亿元的直接损失。

造成云产品宕机的原因多种多样,包括产品漏洞未及时修复、操作不规范、负载过重、黑客入侵、删库跑路等都可能导致宕机。

在当前全球化环境下,90%以上的国际通信业务基本都由海底光缆承担。而海底电缆作为连接全球用户的重要基础设施,也影响着云服务的稳定性与安全性。因为,海底电缆无法避免地会受到自然环境或人类活动的损害,也可能造成网络通信、云服务的故障。

由此可见,即使近年来云计算在全球范围内不断发展成熟,基础设施日趋完善,但依旧存在着云安全风险。在云计算环境下,用户数据直接在云端计算与存储,数据所有权与管理权分离,带来了云环境下的数据安全问题。此外,虚拟化技术使得传统物理安全边界逐渐缺失。不仅如此,不同终端和大量应用的出现,同样给新的安全环境带来了不可预知的威胁。

拥抱混合云

从2021年2月起,Atlassian 正式停售 Sever 本地部署版本,鼓励企业上云。

数字化转型趋势下,企业上云成为未来趋势。但一味鼓励上云,而没有提供安全的上云环境,或是像 Atlassian 这样一刀切的上云政策,可能会引起更大的数据安全隐患。

对中大型企业而言,由于其复杂的业务架构,传统的公有云和私有云都很难满足上云需求。一方面,公有云虽然具备更高的可拓展性,能够降低企业运营成本,但无法满足关键行业对安全的要求,例如金融、通信等行业出于对客户资金、信息安全、行业监管的考虑,很难一步上公有云;另一方面,私有云虽然能够更好地满足企业对安全合规的要求,但其敏捷、灵活度低,企业的运维成本也更高。

在此需求背景下,混合云成为了近年来中大型企业的选择。根据 Flexera 统计,全球企业使用混合云部署的比例超80%。而国内使用云计算服务的企业中,也有超过50%的企业选择了混合云。“十四五”规划更是明确了以混合云为重点的云服务产业发展路线。

image.png

数据来源:Flexera、中国信通院

与单一的公有云或私有云相比,混合云通过将内部基础架构、公有云和私有云服务相连接,打造出兼备公有云的灵活开放性和私有云的安全性的云环境,从而帮助企业更有效且经济地实现其技术和业务目标。

ONES 作为国内领先的企业级研发管理解决方案提供商,提供了公有云、私有云、混合云等多种部署方案,以满足不同行业和企业的个性化需求。同时,ONES 通过了可信云、ISO27001、ISO27018 等多项国内外权威的云计算及信息安全认证,能够为企业提供安全可靠的服务。

目前,ONES 已成功帮助小米、浪潮软件、招商基金、贵州茅台、上汽等多个500强在内的企业实现高效安全的软件研发管理,在各行各业均有成熟的解决方案,助力企业数字化转型。
zhuanlan.zhihu.com
图标


万事ONES
469 声望23.2k 粉丝

ONES专注于企业级研发管理工具及解决方案,产品矩阵贯穿整个研发流程,实践敏捷开发与持续交付,追踪项目进度,量化团队表现,助力企业更好更快发布产品。