Linux 危机工具

主要观点:

  • 展示了多个相关书籍和近期帖子的链接,包括系统性能相关书籍、BPF 性能工具书籍以及一系列技术博客文章。
  • 详细介绍了 2024 年 3 月 24 日的“Linux Crisis Tools”(Linux 危机工具)内容,列举了在 Linux 服务器上默认安装的用于性能诊断的工具包及其提供的功能和注意事项。
  • 通过一个虚构的生产危机案例,说明了在生产危机期间安装软件可能遇到的各种问题,强调了预先安装危机工具的重要性。

关键信息:

  • 相关书籍链接:Systems Performance 2nd Ed.BPF Performance Tools book
  • 近期帖子:涵盖多个时间点的技术博客文章。
  • “Linux Crisis Tools”包含的工具包及信息:如 procps 提供基本统计工具,util-linux 提供系统日志和设备信息工具等,还说明了 bcc 和 bpftrace 工具的特点及未来规划,以及添加这些工具包的主要缺点是磁盘占用。
  • 生产危机安装软件的案例:从网站故障到各种安装问题,如 SSH 登录缓慢、软件包安装失败、网络防火墙问题等,最终新服务器图像启动但仍存在隐患。

重要细节:

  • 各工具包的具体功能,如 procps 中的 ps(1)等命令,util-linux 中的 dmesg(1)等命令。
  • 案例中各个时间点的具体事件和操作,如 4 点多的各种警报和尝试,以及后续的安装失败和网络调试等。
  • 关于 bcc 工具包的发展规划,未来将被替换为更小的“libbpf-tools”包。
阅读 11
0 条评论