7、你的团队对各种警报已经疲劳了
时间:2022-03-05 14:28:02 | 来源:行业动态
时间:2022-03-05 14:28:02 来源:行业动态
IT经理们知道,他们需要实时、持续监控关键业务系统。但是警报太多,和几乎没有警报一样糟糕。
Serediuk说:你可能有100台服务器或5000台服务器,但是你的监控仪表板总是有30个打开的警报。这些警报可能只是已知的问题,但是你仍然有这30个红色标志在盯着你,所以当一个关键的警报弹出时,你怎么能把它从其他30个警报中区分出来呢?
SignalFx是一个基于云的监测平台,该平台解决方案工程负责人John Bruce说,警报疲劳会引发两个潜在的严重问题。一个是IT经理最终忽略这些嘈杂的警报,其中就包括可能是最严重的那个警报。另一个是倦怠和消磨。
他回忆说,他曾经拜访了一个SignalFx客户,这个客户仍然在使用传统工具来监控动态云托管平台。
Bruce说:他们所做的监测系统太嘈杂了,他们的操作人员筋疲力尽。如果你不停地在凌晨3点或4点发出假警报,这感觉是很糟糕的。
经理们需要处理积压的问题并列出优先级,那些能够影响客户、反过来影响他们自己的问题最重要,Serediuk说。
Bruce说,关键是要积极主动,在问题开始影响用户之前使用指标作为早期预警信号。
你需要早期的指标,说:好吧,这项服务看起来正在走下坡路,我该怎么做才能防止这个情况呢?而不是服务器和客户端服务已经关闭了,我们需要加入这场战斗。