日常工作

在做系统管理员或者运维工程师时,我们会被大量的日常繁琐事务占据时间,疲于奔命。接不完的电话,处理不完的工单,催促着我们不停的工作使我们缺乏时间去思考提升效率并为此做出努力。通常我们需要处理的日常工作通常有以下几个特征:

  • 手动性:需要手动去执行某些命令或脚本来解决问题
  • 重复性:不停的重复执行某一操作或脚本,但时间不固定
  • 可自动化:一些工作可以通过shell/python等脚本编程自动化或批量执行,如定时任务
  • 临时性:很难预料到会出现什么问题及何时出现,例如故障处理,on-call工作等
  • 无长期价值:一次性的工作,例如数据中心迁移,编写一次性脚本等无法复用的工作结果
  • 持续增长性:随着业务规模扩大,运维工作量也持续上升

工程性工作

当我们成为SRE时,上述的工作不应该占据我们的大部分工作时间。我们的精力应当主要投入到Engineering,即工程性工作中,以减少重复性工作,提升我们的工作效率。

工程性工作一项具有挑战性,具有成就感,需要主观判断的工作,它必须具有长期价值,能够对我们的业务系统带来持久性改善。主要包括以下几项:

软件工程

通过设计和编写代码或者是整合工具链,开发新型软件平台来实现运维工作。例如通过现有的gitlab,Jenkins等软件构建自己的发布流水线,利用蓝鲸等开源平台打造自己的CMDB系统或混合云管理系统,从而提升研发工作效率和稳定性,减少手动和重新性工作

系统工程

生产系统配置,基础架构设计,负载均衡及DNS系统建设等

体系工程

与运维相关的体系建设,如团队培养,运维知识库建设,应急管理体系,日常运维规范,工作总结,跨部门合作

两者关系:

SRE必须要参与到日常工作中去,只有这样才能有效的了解运维工作中的痛点及可行的改善方法,也是工程性工作的需求输入端之一。但是如果此类工作过多,花在工程项目上的时间太少会导致自己的思维受限,不能够以更高的视角来审视工作,把自己局促在一个封闭的重复性工作圈子内。缺乏对技术的敏感性和前瞻性,创新性工作过少,导致职业发展停滞。做工程项目最锻炼人,它需要SRE从全局视角审视工作。从项目立项到最终交付用户,SRE不仅仅要解决技术框架问题,更要解决和不同部门之间的沟通矛盾,明白其他部门的需求,并以合适的方式体现在交付成果中。


千里之行
1 声望2 粉丝

SRE体系践行者