WGCLOUD运维监控系统有个新的特性叫做告警缓存间隔时间,顾名思义就是把告警通知缓存起来,同一条告警通知不会不停的发送了,但是监测工作会一直进行,设计初衷是预留给运维同学时间去排查处理故障。
比如主机192.168.1.2下线了,我们在钉钉收到一条告警通知
WGCLOUD默认的告警缓存间隔时间是2小时,那么2小时内,我们不会再重复收到这条告警通知,2小时后我们会继续收到第二条通知。
除非它恢复上线,我们会收到192.168.1.2主机已经恢复上线通知,如果之后它再次下线,我们还会收到下线告警通知,因为恢复不属于告警,所以没有缓存。
以下是WGCLOUD的告警缓存配置,在server/config/application.yml中找到如下配置项
#告警缓存时间间隔(此时间段内同一告警通知不再重复发),单位秒,默认120分钟。此期间只是不推送告警到第三方(邮件钉钉微信等)了,系统监控扫描工作仍正常进行
warnCacheTimes: 7200
我们可以跟进自己的场景需要,对它进行调整,修改后记得重启server
另外注意配置文件中的配置项,冒号后需要保留一个英文空格
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。