prometheus-2.36.0采集信息的 scrape_interval最大值是多少?
prometheus-2.36.0.linux-amd64
想设置它的采集数据间隔为5分钟1次 把
prometheus.yml
改成
scrape_interval: 300s
evaluation_interval: 300s
结果出来的的图是这样
正常情况下的图应该是这样
1、在 Prometheus 的配置文件 prometheus.yml 中,可以设置 scrape_interval 和 evaluation_interval 为 300s 来实现每 5 分钟采集一次数据。例如:
scrape_interval: 300s
evaluation_interval: 300s
这样就可以让 Prometheus 每 5 分钟采集一次监控数据,并在图形展示中正常显示出来。
2、在 Alertmanager 的配置文件 alertmanager.yml 中,可以设置 group_interval 和 repeat_interval 为 5m 来控制故障告警的发送频率。例如:
group_interval: 5m
repeat_interval: 5m
这样就可以让 Alertmanager 每 5 分钟检查一次是否有故障告警需要发送。如果有,就会发送故障告警。
如果故障持续时间超过 group_interval 和 repeat_interval 的总和,就 Alertmanager 会持续发送故障告警。假如 group_interval 和 repeat_interval 均设置为 5m,就故障出现后最长的告警时间为 10 分钟(5m + 5m)。
望采纳。
PromQL 万字详解
借鉴下
https://blog.csdn.net/agonie201218/article/details/122056239
1.在 prometheus.yml 中,可以将 scrape_interval 设置为 300s 来实现每 5 分钟采集一次数据。例如:
scrape_interval: 300s
在 alertmanager.yml 中,可以将 group_interval 和 repeat_interval 都设置为 300s 来实现每 5 分钟重新发送一次告警。例如:
group_interval: 300s
repeat_interval: 300s
2.在 alertmanager.yml 中,group_interval 和 repeat_interval 都设置为 5m 意味着告警将每 5 分钟重新发送一次。因此如果故障持续时间超过 5 分钟,那么告警将持续发送,直到故障恢复为止。例如,如果故障持续了 30 分钟,那么告警将在 5 分钟、10 分钟、15 分钟、20 分钟、25 分钟和 30 分钟处重新发送。因此最长的告警时间为 30 分钟。