我的 71 TiB ZFS 网络附加存储(NAS)在 10 年后且零驱动器故障

主要观点:作者拥有一台用 24 个 4TB 硬盘构建的 10 多年的4U 71TiB ZFS NAS,至今仍运行良好,零硬盘故障,探讨了硬盘、主板、ZFS、噪音、网络、电源、UPS、备份等方面,还提及未来存储计划。
关键信息:

  • 硬盘:HGST 4TB 硬盘使用约 6000 小时,约 250 天运行时间,秘诀是不用时关机。
  • 主板:几年前更换,故障模式为无法进入 BIOS 且偶尔无法启动,在 Ebay 上可找到同款。
  • ZFS:多年运行良好,跨操作系统导入池无问题,每年 scrub 几次未发现校验和错误,风险小但值得学习。
  • 噪音:机箱内 3 个 12V 风扇默认转速很响,通过脚本根据最热硬盘温度控制风扇转速,保持 40°C 以下。
  • 网络:起初用四端口千兆网络控制器通过网络绑定达到 450MB/s 传输速度,后用 Infiniband 卡达到 700MB/s,因系统迁移改用二手 10Gbit 以太网卡。
  • 电源:开机时所有硬盘同时启动约 600W 几秒,电源额定 750W 12 伏轨有时在启动时会切断。
  • UPS:曾用大型 UPS 防止断电,后因 UPS 耗电决定放弃,接受断电风险。
  • 备份:重要数据备份三次,其他数据未备份,依靠硬件和 ZFS 防止数据丢失。
  • 未来存储计划:暂无计划,有 spare 硬件可修复系统,可能因硬盘尺寸增加更换为小尺寸机箱或不再更换。
    重要细节:
  • 作者通过脚本远程控制 NAS 的开关机,关机时先关闭服务器再关闭墙插,避免主板持续耗电。
  • 在 Hacker News 上有人认为 10 年 24 个硬盘零故障的概率比作者认为的高,不一定与关机有关。
  • ZFS 的 silent data corruption 风险极小,在数据中心需重视,住宅使用可接受。
  • 作者为找到合适的风扇控制算法求助数学相关 subreddit,使用 PID 控制器平衡噪音和散热。
  • 因系统迁移,Infiniband 卡不再工作,改用二手 10Gbit 以太网卡。
阅读 13
0 条评论