主要观点:阅读对站点可靠性工程师(SRE)至关重要,需具备多领域知识,文中推荐 9 本相关书籍。
关键信息:
- 谷歌 SRE 团队的《Site Reliability Engineering》涵盖 SRE 日常关注的众多主题,在线免费,是必读书籍。
- 《The Site Reliability Workbook》是前书的延续,提供更多实施细节,也可在线免费阅读。
- 《Systems Performance》通过 USE 方法助快速排查性能问题,可深入理解 Linux 操作系统性能排查。
- 《The Linux Programming Interface》加深对操作系统理解,尤其 Linux 系统调用接口,对使用 Linux 运行生产系统的团队很有价值。
- 《TCP/IP Illustrated: The Protocols, Volume 1》学习核心网络协议,了解协议底层工作原理。
- 《The Illustrated Network: How TCP/IP Works in a Modern Network》聚焦现代网络环境中 TCP/IP 基本原理。
- 《Designing Data-Intensive Applications》从数据导向系统角度理解分布式系统,对分布式数据库系统工作者必读。
- 《Building Secure and Reliable Systems》将安全与可靠性相结合,谷歌免费提供。
- 还应阅读特定领域书籍以提升工作效率。
重要细节:各书的具体内容介绍及获取链接,如《Site Reliability Engineering》在线版本地址等。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。