问题描述

nagios配合nrpe用来监控机器中运行项目的具体情况,还包括磁盘、网络、负载均衡和数据库等具体的使用情况;

我遇到的问题:

  • 使用docker-compose替换原来项目,将所有的进程docker化;
  • 创建的docker镜像和docker-compose创建的containers都在/var/lib/docker目录下;
  • 在使用docker-compose up的时候,出现警报 XXXXX(inode=-9999%)/var/lib/docker/containers/mounts=6037182531735MB;4830712380730;5434551428321;0;6038390475913

解决的过程遇到的坑

解决的思路:

  • 首先想的是既然报磁盘没有空间的错误,那就需要看这个目录到底是谁占用了这么多的空间:查看的时候发现,/var/lib/docker/目录没有权限,不能查看,所以我一路开权限,然后chmod,知道看到的结果是征程很正常
  • 接着因为权限打开,警报消除,但是当我重新docker-compose up的时候,加入新的镜像,又出现这个问题;无解
  • 想通过忽略指定的文件,让他消失在我的眼前,于是找到了-i ·regex·;但是当我修改之后,出现了Unknown告警;

无解。。。。。

df

通过查看我的磁盘使用情况,并没有发现有什么不妥,而且,command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/vda1,看起来也没有问题哦;

  • 是不是/dev/vda1/有问题,于是command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/vda1 -i '/dev/vda1/var/lib/dockder/',但是也不行

最终解决的方法

```command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p / -i '/var/lib/dockder/'```

这个命令OK,生效了!为什么呢?你可以想一下,我今记录一下我的解决问题的过程。


sixgo
156 声望4 粉丝

这里有BUG!