头图

在今年,平台工程正在迅速在 IT 企业中崭露头角,成为软件开发团队的必要实践。根据 CloudBees 发布的最新报告《2023年平台工程:快速采纳和影响》,83%的受访者已经完全实施了平台工程,或正处于某种实施阶段。
 

平台工程是一门设计和构建内部开发者平台(IDP)、工具链和工作流程的学科,它为软件工程团队提供了自助服务的能力。
 

IT 领导者一直在不断面临着要用更少的资源做更多事情的挑战。根据各种研究,开发者每周实际上只用了12.5%到30%的时间来编写代码。这也促使 IT 和 DevOps 领导者迫切寻找新的方法来提高开发者的生产力。由于平台工程建立了改进开发者生产力和开发者体验(DevEx)的最佳实践,因此已经成为备受关注的领域。
 

平台工程的实践已经成功地分担了开发者的大部分工作负担。调查数据显示,已经采用或计划采用平台工程的水平相当高(83%),其中:

  • 20% 已经完全实施
  • 33% 正在进行中
  • 11% 最近刚刚开始
  • 19% 处于规划阶段

仅有17%的受访者表示他们没有计划推出平台工程。
 

图片来源:CloudBees
 

平台工程的五个主要推动因素各约占回应的20%,并展示了平台工程对开发者和DevOps团队的重要和广泛好处。采用平台工程的推动因素包括:

  • 开发者生产力(21%)
  • 持续集成和持续交付(CI/CD)流水线的实施(20%)
  • 工具和流程的标准化(20%)
  • 安全性增强(20%)
  • 基础设施即代码(19%)
     

业务影响

在过去的10年中,随着DevOps的崛起,平台工程的突出地位通常被归因于“我们忘记了开发者!”的现象。在DevOps崛起期间,许多事情向左移动,进一步加重了开发者的负担,并分散了注意力,使其远离了编码和创新。组织投资于平台工程,以满足多种需求。
 

与关注开发者生产力一致,平台工程的前五个用例中有三个:

  • 开发、测试和生产环境的管理(22%)
  • CI/CD 流水线管理(21%)
  • 开发者平台即服务(PaaS)(18%)
     

目标和成功衡量标准

几乎所有最重要的平台工程目标都与 DevEx 和提高开发者生产力相关。排名最高的三个目标是:

  • 开发者的自助服务(29%)
  • 于采用(25%)
  • 满足开发者需求(20%)
     

平台工程团队的成功衡量标准包括:

  • 开发者生产力(23%)
  • 内部KPI达标(19%)
  • 成本控制(16%)
  • 管理工具扩张(13%)
     

最后,调查显示,组织内的平台工程的归属位置各不相同,但最常见的归属位置包括:

  • 云工程(30%)
  • 基础设施团队(25%)
  • 开发部门(20%)
  • 共享服务(13%)
  • 运维部门(13%)
     

根据调查数据显示,许多组织广泛采用平台工程,并将平台工程视为最大程度提高软件开发效率的关键元素
 

平台工程与 AI

平台工程在接下来的12至18个月内将会面临什么挑战?
 

平台团队需要为持续的变化做好准备。公司被收购,新平台被收购(通常不会放弃旧平台),新应用程序和部署模式将继续出现。最近出现的颠覆性技术是生成式人工智能(AI),紧随其后的是人工智能(AI),特别是机器学习(ML)。AI 可以并将被应用于改进平台工程。
 

然而,像创建、运营和保护软件和系统的其他方面一样,AI/ML和生成式 AI 也带来了挑战。我们看到了三个关键方面:
 

首先是管理多个大型数据集和模型,这是 ML 算法和生成式 AI 大型语言模型(LLM)的生命线。类似于专门的专家系统,基于企业内部数据训练的特定领域的 LLM 在采用生成式 AI 时将变得尤为重要,前提是要维护数据的隐私和安全。
 

平台工程必须适应新的 AI 工作流程和数据、提示以及设计、训练和维护模型、向量数据库和大型数据集的 AI 工程师的流水线,这些数据集会不断增长和演变。这些 AI 流水线必须支持其工作流模式的特定要求,并与相互依赖的软件开发流水线和发布流程相一致和整合。
 

另外 AI/ML 和生成式 AI 通常具有与我们今天理解和运营的云和应用环境分开的操作特性。AI 引入了新的硬件操作环境,包括 AI 加速器、GPU、VPU和高度可扩展的 CPU,以及具有挑战性的性能和优化学习曲线。随着 AI,特别是生成式 AI 在企业中被采用和推广,平台工程将发挥关键作用。
 

关于 Walrus

Walrus 是基于平台工程理念构建的全新一代应用管理平台,其一键部署和克隆复杂应用系统、集成 AI 大语言模型简化模板代码生成以及灵活强大的应用和环境动态管理能力等特性备受用户青睐。借助 Walrus 用户可以将云原生的能力和最佳实践扩展到非容器化环境,并支持任意应用形态统一编排部署,降低使用基础设施的复杂度,为研发和运维团队提供易用、一致的应用管理体验,进而构建无缝协作的软件交付流程,加速企业业务创新。开源地址:github.com/seal-io/walrus
 

参考链接:

  1. https://www.devopsdigest.com/platform-engineering-2023
  2. https://www.cloudbees.com/platform-engineering-research

 


Seal
1 声望3 粉丝

GPUStack,一个用于运行 LLM(大型语言模型)的开源 GPU 集群管理器。