从北京时间4月5号起,研发管理协同领域的海外标杆公司 Atlassian 的 Cloud 版本发生宕机事故,导致 Jira、Confluence 在内的至少7款产品无法访问。Atlassian 目前市值不到700亿美元,年营业额超25亿美元,其中最大收入来源就是项目管理和知识库管理组合「Jira + Confluence 」。
根据 Atlassian 官方透露,此次宕机事故影响了全球约400家企业客户,截止4月13日,宕机已持续9天,故障仍未完全被修复。
这一「旷日持久」的宕机事件,再次引发了业界对于上云如何保障数据安全的话题。
事故之谜
宕机事故发生48小时后,多名用户表示难以联系到官方获得支持,部分得到官方回复的也只是告知「问题仍需几天修复」。
事故发生2天后的4月7日,Atlassian 在其 Twitter 账号简述了事故原因:「在执行例行维护脚本时,少数网站无意中被禁用,导致他们无法访问其产品和数据。」
同时,官方表示已投入大量工程师7/24全天候致力于修复此问题,并将在修复完成后,出具详细的事后分析报告。
此次事故将带来哪些具体影响,需要在日后一一计算。但数据安全显然已经成为了众多客户最担忧的事情。
官方账号 @Ask Atlassian 在 Twitter 中的一项声明似乎表明了此次事件将可能造成部分客户的数据丢失,引发了大量客户的讨论与担忧。4月8日,海外 IT 新闻媒体 TechTarget 在一则新闻中也指出,有客户质疑了官方的事故原因,因为按照官方给的说法,是不需要这么长时间、投入这么多人力进行修复的。
接着,4月12日,Atlassian 官方发布通知,目前已帮助45%的客户完成站点重建。然而由于重建工作的复杂性,他们预计还需要2周的时间才能完成所有的重建工作。
其实,早在4月6日停服超过24小时的时候,Atlassian 已经违反了「服务水平协议」(SLA, Service Level Agreement)。根据该协议,Atlassian 云产品的每月正常运行时间应在99.9%(Premium)或99.95%(Enterprise)以上,即停机时间不能超过45分钟/月。
而今,事故已经持续9天甚至更久,远远超过了 Atlassian 在协议中承诺的停机时间。
去年10月底,Atlassian 市值最高曾超1200亿美元,其后股价一直下滑,今年3月初相比去年11月,市值已经「腰斩」。截止4月11日,其市值为688.55亿美元。此次事故对其股价持续下跌的趋势或许是「雪上加霜」。
尽管此次事故原因和影响还有待进一步调查和核算,但业界的焦点一致指向了「上云如何保障数据安全」这个话题。
安全!安全!
Atlassian 云版本宕机事故在整个云计算行业并不罕见。实际上,在过去的几年里,国内外的云服务厂商、SaaS 软件厂商宕机事故频发。
2010年至2019年间,AWS 平均每年宕机次数达2.4次。而仅在2021年12月,AWS 就连续发生了3次宕机。IBM Cloud 在2021年5月,5天内发生2次宕机事件;Google Cloud 于2021年发生2次宕机;Microsoft Azure 于2021年10月发生长达6小时的宕机。
国内外 SaaS 厂商同样发生了几次严重宕机事故。2021年,SaaS 鼻祖 Salesforce 因为一位运维工程师未遵守规范,企图走捷径修 Bug 而造成了长达5小时的全球宕机,使15万客户的 CRM 系统陷入瘫痪。在国内,2020年的微盟程序员删库跑路事件也导致了300万余用户无法正常使用该公司的 SaaS 产品,给公司造成了近亿元的直接损失。
造成云产品宕机的原因多种多样,包括产品漏洞未及时修复、操作不规范、负载过重、黑客入侵、删库跑路等都可能导致宕机。
在当前全球化环境下,90%以上的国际通信业务基本都由海底光缆承担。而海底电缆作为连接全球用户的重要基础设施,也影响着云服务的稳定性与安全性。因为,海底电缆无法避免地会受到自然环境或人类活动的损害,也可能造成网络通信、云服务的故障。
由此可见,即使近年来云计算在全球范围内不断发展成熟,基础设施日趋完善,但依旧存在着云安全风险。在云计算环境下,用户数据直接在云端计算与存储,数据所有权与管理权分离,带来了云环境下的数据安全问题。此外,虚拟化技术使得传统物理安全边界逐渐缺失。不仅如此,不同终端和大量应用的出现,同样给新的安全环境带来了不可预知的威胁。
拥抱混合云
从2021年2月起,Atlassian 正式停售 Sever 本地部署版本,鼓励企业上云。
数字化转型趋势下,企业上云成为未来趋势。但一味鼓励上云,而没有提供安全的上云环境,或是像 Atlassian 这样一刀切的上云政策,可能会引起更大的数据安全隐患。
对中大型企业而言,由于其复杂的业务架构,传统的公有云和私有云都很难满足上云需求。一方面,公有云虽然具备更高的可拓展性,能够降低企业运营成本,但无法满足关键行业对安全的要求,例如金融、通信等行业出于对客户资金、信息安全、行业监管的考虑,很难一步上公有云;另一方面,私有云虽然能够更好地满足企业对安全合规的要求,但其敏捷、灵活度低,企业的运维成本也更高。
在此需求背景下,混合云成为了近年来中大型企业的选择。根据 Flexera 统计,全球企业使用混合云部署的比例超80%。而国内使用云计算服务的企业中,也有超过50%的企业选择了混合云。“十四五”规划更是明确了以混合云为重点的云服务产业发展路线。
数据来源:Flexera、中国信通院
与单一的公有云或私有云相比,混合云通过将内部基础架构、公有云和私有云服务相连接,打造出兼备公有云的灵活开放性和私有云的安全性的云环境,从而帮助企业更有效且经济地实现其技术和业务目标。
ONES 作为国内领先的企业级研发管理解决方案提供商,提供了公有云、私有云、混合云等多种部署方案,以满足不同行业和企业的个性化需求。同时,ONES 通过了可信云、ISO27001、ISO27018 等多项国内外权威的云计算及信息安全认证,能够为企业提供安全可靠的服务。
目前,ONES 已成功帮助小米、浪潮软件、招商基金、贵州茅台、上汽等多个500强在内的企业实现高效安全的软件研发管理,在各行各业均有成熟的解决方案,助力企业数字化转型。
zhuanlan.zhihu.com
图标
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。