這篇文章將為大家詳細(xì)講解有關(guān)k8s node alertmanager監(jiān)控報(bào)警配置方法是什么,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個(gè)參考,希望大家閱讀完這篇文章后對(duì)相關(guān)知識(shí)有一定的了解。
概述
節(jié)點(diǎn)本身的監(jiān)控主要監(jiān)控cpu、內(nèi)存、磁盤(pán)io、文件系統(tǒng)可用空間即可。
比如,對(duì)于使用來(lái)prometheus的alertmanager來(lái)做node報(bào)警,rules配置可以參考如下點(diǎn)進(jìn)行配置即可。
說(shuō)明
不同的node-exporter版本,對(duì)應(yīng)的metrics也不一樣,需要自己對(duì)照更改一下。
cpu監(jiān)控
(1 – avg(irate(node_cpu{mode=\”idle\”}[10m])) by (instance)) * 100 < 90
內(nèi)存監(jiān)控
((node_memory_memtotal – node_memory_memfree) / node_memory_memtotal) * 100 < 90
磁盤(pán)io監(jiān)控
(max(avg(irate(node_disk_io_time_ms[10m])) by (instance, device)) by (instance))/10
文件系統(tǒng)可用空間監(jiān)控
max(((node_filesystem_size{fstype=~\”ext4|vfat\”} – node_filesystem_free{fstype=~\”ext4|vfat\”}) / node_filesystem_size{fstype=~\”ext4|vfat\”}) * 100) by (instance) > 90
關(guān)于k8s node alertmanager監(jiān)控報(bào)警配置方法是什么就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,可以學(xué)到更多知識(shí)。如果覺(jué)得文章不錯(cuò),可以把它分享出去讓更多的人看到。