技术编辑:徐九丨发自 北京
SegmentFault 思否报道丨公众号:SegmentFault
无论企业规模大小,都有可能发生重大的 IT 事故,为此 Google 出版了一本新书,来让企业避免和应对外部攻击者以及内部改动造成的事故。
新书名为《Building Secure & Reliable Systems(构建安全可靠的系统)》,重点介绍 Google 如何将 SRE 方法引入安全性,以及安全性在软件产品开发和运营中的作用。
Google 此前发布的关于 SRE 的书籍虽然涵盖了 SRE 的最佳实践,但没有涉及可靠性和安全性之间的联系。此次新发布的图书电子版共计 500 多页,详细介绍了影响 Google 内部系统和产品(如 YouTube)的众多故障。重要的是,新书还揭示了其站点可靠性工程和安全团队如何合作保护 Google 系统,从 Android 到 Chrome、Gmail、搜索和 Google Cloud。
本书开头提出了一个问题:“如果系统从根本上来说不是安全的,那么还可以认为它是真正可靠的吗?如果系统不可靠,那么可以认为它是安全的吗?”。
SRE 原则
SRE(Site Reliability Engineering)即网站可靠性工程,它源起于谷歌内部产品技术保障过程中演进而来的运维新模型,并且定义了新岗位的职责范围。
提及 SRE 很多人会联想到运维工程师、系统工程师,其实不然。区别于传统运维模式,SRE 强调自动化系统,主张通过软件工程方式开发出一些场景化的自动化运维工具来替代重复和手工操作。
谷歌已经使用 SRE 原则近二十年了,虽然世界上很少有公司能具备 Google 的规模,但是尽管如此,在 Google 的书中仍可以吸取经验教训。
Gmail 的早期 SRE 负责人 Royal Hansen 分享此书时提到:“SRE 是一流的可靠性方法。并且,它在实时检测和响应技术问题(包括对特权访问或敏感数据的安全性攻击)方面也发挥着作用。工程团队通常根据专业技能在组织上分开,他们的共同目标是:确保系统或应用程序的质量和安全性。”
Google SRE 官网:https://landing.google.com/sre/
不方便自行下载的朋友,可以扫描下方二维码并回复关键词「SRE」,获取《Building Secure & Reliable Systems(构建安全可靠的系统)》完整版 PDF。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。