算法在ops中的应用场景

2015-04-21
阅读 2 分钟
3.4k
告警系统的误警和漏警如何计算?在线上运行的告警设置必然是会受到骚扰频次的限制。门限设得过高就可能会漏警。但是如果每天执行一次告警质量的检查算法,然后给出一堆疑似的漏警和误警,然后结合人工辅助可以更快地发现漏警和误警的情况。

使用算法检测异常 - 问题描述

2014-10-19
阅读 6 分钟
9.9k
背景 任何一个产生环境的IT系统如果要长久下去,必须对其进行监控告警。常见的实现分为三个部分 采集目标系统的指标,并上报到中央服务器 对指标按时间窗口进行统计,并存储成为曲线 对曲线进行异常检测,在必要的时候告警通知运维人员 在过去,对于第1、2两点我们已经积累非常多的文章和工具来谈论如何来实施一个“监控...