目前我是配置了一个prometheus blackbox-exporter 然后指定了要ping的ip用来检测主机连通性,出现的问题是我配置的报警规则居然不触发,其他的如http检测都可以触发,就icmp触发不了报警规则配置如下,希望指点一下
[root@docker-3 alertmanager]# vim /usr/local/prometheus/prometheus.yml
//1、修改prometheus.yml 的alerting 部分
# Alertmanager configuration
alerting:
alertmanagers:
- static_configs:
- targets:
- 172.16.0.9:9093
//2、定义告警文件:
rule_files:
- rules/*.yml
[root@docker-3 alertmanager]# cd /usr/local/prometheus
[root@docker-3 alertmanager]# mkdir rules
[root@docker-3 alertmanager]# cd rules/
[root@docker-3 rules]# cat host_monitor.yml
groups:
- name: node-up
rules:
- alert: node-up
expr: up == 0
for: 15s
labels:
severity: 1
team: node
annotations:
summary: "{{$labels.instance}}Instance has been down for more than 5 minutes"
//检查配置文件
[root@docker-3 alertmanager]# /usr/local/prometheus/promtool check config /usr/local/prometheus/prometheus.yml
//重启Prometheus
[root@docker-3 alertmanager]# systemctl restart prometheus
- alert:告警规则的名称。
- expr:基于PromQL 表达式告警触发条件,用于计算是否有时间序列满足该条件。
- for:评估等待时间,可选参数。用于表示只有当触发条件持续一段时间后才发送告警。在
等待期间新产生告警的状态为pending。- labels:自定义标签,允许用户指定要附加到告警上的一组附加标签。
- annotations:用于指定一组附加信息,比如用于描述告警详细信息的文字等,annotations
的内容在告警产生时会一同作为参数发送到Alertmanager。- summary 描述告警的概要信息,description 用于描述告警的详细信息。
- 同时Alertmanager 的UI 也会根据这两个标签值,显示告警信息。