容器里面有几个pod需要通过脚本来实现监控
监控目标是 pod的名称 如果过pod重启了 pod名称发生了变化 就发出告警 ,告警的内容是 哪一个pod 有重启,请关注
需要监控的pod如下:
[root@master1 nescadmin]# kubectl get pod -n prophet-resource-5 | awk '{print$1}' |grep ^pas-7b
pas-7b6e99d1-393b-4d09-86ee-5f17dc10fc87-25-48-function-597sxzk
pas-7b6e99d1-393b-4d09-86ee-5f17dc10fc87-25-48-function-59cdncq
pas-7b6e99d1-393b-4d09-86ee-5f17dc10fc87-25-48-function-59cxww7
pas-7b6e99d1-393b-4d09-86ee-5f17dc10fc87-25-48-function-59hlgb6
pas-7b6e99d1-393b-4d09-86ee-5f17dc10fc87-25-48-function-59pgpnd
pas-7b6e99d1-393b-4d09-86ee-5f17dc10fc87-25-48-function-59x6z77
pas-7b6e99d1-393b-4d09-86ee-5f17dc10fc87-25-48-function-59xmqzz
pas-7b6e99d1-393b-4d09-86ee-5f17dc10fc87-25-48-function-59zlpn5
pod 名称放到一个临时文件,对比两个文件,输出 pod name
首先你是使用什么进行监控,比如zabbix、普罗米修斯,如果是zabbix只需要写个脚本得出pod的数量,你这个命令后面加个|wc -l就可以计算出数量,在zabbix加入自定义监控项,创建一个触发器,触发器设置为:“与上一次发生变化就告警”“不等于某个值就告警”