监控能力建设过程中,监控指标会越来越全面,产生的告警、预警信息也更为丰富,但是大量的告警似乎不能提高运维的效率,因为需要有效处理的告警比例在降低,请问如何提高告警的有效性,或者怎么样突出告警的优先级和相关性?
可以通过以下几个方面来提高告警的有效性:
其实说到底运维不是一个人的活预警信息要推给相关人员去维护管理、备品备件而不是一股脑丢给维修人员东西坏了才找维修人员东西没坏告诉维修人员有什么用呢什么信息都丢给一个人处理那只能是降低效率,而不是提高效率