问题描述
nagios配合nrpe用来监控机器中运行项目的具体情况,还包括磁盘、网络、负载均衡和数据库等具体的使用情况;
我遇到的问题:
- 使用docker-compose替换原来项目,将所有的进程docker化;
- 创建的docker镜像和docker-compose创建的containers都在/var/lib/docker目录下;
- 在使用docker-compose up的时候,出现警报
XXXXX(inode=-9999%)/var/lib/docker/containers/mounts=6037182531735MB;4830712380730;5434551428321;0;6038390475913
解决的过程遇到的坑
解决的思路:
- 首先想的是既然报磁盘没有空间的错误,那就需要看这个目录到底是谁占用了这么多的空间:查看的时候发现,/var/lib/docker/目录没有权限,不能查看,所以我一路开权限,然后chmod,知道看到的结果是征程很正常
- 接着因为权限打开,警报消除,但是当我重新docker-compose up的时候,加入新的镜像,又出现这个问题;无解
- 想通过忽略指定的文件,让他消失在我的眼前,于是找到了-i ·regex·;但是当我修改之后,出现了Unknown告警;
无解。。。。。
通过查看我的磁盘使用情况,并没有发现有什么不妥,而且,command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/vda1
,看起来也没有问题哦;
- 是不是/dev/vda1/有问题,于是
command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/vda1 -i '/dev/vda1/var/lib/dockder/'
,但是也不行
最终解决的方法
```command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p / -i '/var/lib/dockder/'```
这个命令OK,生效了!为什么呢?你可以想一下,我今记录一下我的解决问题的过程。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。