本文译自 Four Steps to Avoiding a Cloud Cost Incident。作者:ASIM RAZZAQ
最近的《Flexera 2022 云计算状况报告》中指出,企业在云计算成本的浪费上,达到了 32%,高于去年的 30%。如果不及时发现和纠正,会产生更加巨大的财务影响。
随着企业的云基础设施的成熟,将云资源使用和成本准确映射到产品线、团队和业务部门变得越来越复杂,问题也越来越多。然而,准确的云成本计算,对于团队资源使用和确定销售成本 (COGS) 利润率至关重要,对于企业拟定预算也必不可少。企业需要更加可靠的、精细的云成本视图,以便将成本归结到各部门,并在更有意义的业务上增加预算。
云计算成本的激增会迅速消耗企业的预算,而且很难追踪,本文将介绍几个简单的步骤来帮助企业免受云计算成本事件的影响。
制定强有力的标签策略,对成本进行细化归属
首先,IT 团队需要确定哪些服务对业务有促进作用,这将有助于定义和创建标签策略。
例如,当组织中有两个团队管理同一服务时,这些团队应该保护带有团队成本标签的服务。此外,团队应该为他们运行的环境添加另一个标签,以便他们可以跨团队和环境之间分配云成本。
当应用程序使用大量资源(如数据库和存储)时,团队应考虑添加特定的应用程序标签并按每个应用程序分解成本。需要注意的是,没有一个放之四海而皆准的标签解决方案,因此企业需要确定什么是有效的,然后通过添加和删除标签来尝试不同的策略。
了解云成本所有权以避免混乱
企业在将云计算成本归入团队、应用程序或 COGS 方面做得好不好,可以直接归咎于云成本与业务之间关系的重要信息。
由于缺乏这种背景或对资源分配的可见性,使得 IT 团队和领导无法就谁负责各种费用和资源达成一致。人工成本归属不能准确扩展,也不能考虑到跨团队和应用之间的共享集群资源使用。这就造成了混乱,当用户任意切割数据而没有明确责任时,这种混乱就会升级。
还有一些情况是,成本有时会被重复计算,有两个所有者,甚至完全没有所有者。由此产生的数据是不可靠的。这就无法将资源使用情况可视化,也会削弱、阻碍甚至击败成本改进措施和优化。
云计算成本应该有一个所有者,能够确保云计算支出与商业价值挂钩。了解谁拥有哪些部分资源,将有助于找出原因。
建立和监控云预算
云计算支出的历史数据是重要的,它可以帮助预测和预算云计算的成本足迹应该发生的事情。如果没有发生这种情况,那么应该对其进行标记和调查。
一旦掌握了成本数据,企业就可以准确了解云计算支出的情况。然而,这是否符合支出的预期呢?通过在项目的每个阶段建立和监控预算,企业可以为云计算支出设置护栏,防止工程师在 "以防万一 "的情况下过度分配性能而导致成本飙升,失去控制。一旦预算到位,企业就可以监控支出并调整资源规模以平衡实际使用情况,而不是在执行开始时估计使用情况。
随着时间的推移,适当调整资源规模将实现最佳支出,并确定可以关闭的未使用的资源。企业应识别不再需要的开发和测试实例,并将其关闭。
实施成本异常检测
企业可以通过持续监控和优化云计算成本来保护自己免受成本异常的影响。成本异常检测可以帮助在它们成为问题之前尽早识别。当资源所有者的预测超出设定预算时,可以通过 Slack 或电子邮件直接向资源所有者发送及时、可操作的警报,这一点尤其有效。最好的选择是采用云成本监控和优化 (CCMO) 工具,在发生成本异常时实时发出警报。这些工具必须能够检测异常并分析其根本原因,同时还可以查看问题所在,以避免未来出现类似的错误。
为动态云环境执行持续成本监控和异常检测工具,对于识别与预期支出不一致或偏离既定模式的活动至关重要。通过适当的监控,企业可以在事前采取纠正措施。
不需要的和意外的成本事件会消耗企业的预算,特别是在云基础设施增长的时候。企业需要实践这些步骤,以了解云环境的全貌。
云原生技术社区有20+技术交流群,想进群跟技术大牛们聊天,vx:alaudacloudnative
本文由mdnice多平台发布
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。