Prometheus Node_exporter 之 Basic CPU / Mem / Disk Gauge


1. CPU Busy :收集所有 cpu 內核 busy 狀態占比


type: Singlestat
Unit: perent(0-100)
(所有 cpu使用情況 - 5分鍾內 cpu 空閑的平均值) / 所有 cpu使用情況
metrics:

(((count(count(node_cpu_seconds_total{instance=~\"$node:$port\",job=~\"$job\"}) by (cpu))) - avg(sum by (mode)(irate(node_cpu_seconds_total{mode='idle',instance=~\"$node:$port\",job=~\"$job\"}[5m])))) * 100) / count(count(node_cpu_seconds_total{instance=~\"$node:$port\",job=~\"$job\"}) by (cpu))

最大值: 100%

2. Used RAM Memory free -m


type: Singlestat
Unit: perent(0-100)
已使用的內存占比(包括Buffer緩存和Cached緩存)
metrics:

((node_memory_MemTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} - node_memory_MemFree_bytes{instance=~\"$node:$port\",job=~\"$job\"}) / (node_memory_MemTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} )) * 100


node_memory_MemFree_bytes 空閑內存

已使用的內存占比(不包括Buffer緩存和Cached緩存)
metrics:

100 - ((node_memory_MemAvailable_bytes{instance=~"$node:$port",job=~"$job"} * 100) / node_memory_MemTotal_bytes{instance=~"$node:$port",job=~"$job"})

MemAvailable: Free + Buffers + Cached - 不可回收的部分。不可回收部分包括:共享內存段,tmpfs,ramfs等

3. Used SWAP: 交換分區使用率


type: Singlestat
Unit: perent(0-100)
metrics:

((node_memory_SwapTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} - node_memory_SwapFree_bytes{instance=~\"$node:$port\",job=~\"$job\"}) / (node_memory_SwapTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} )) * 100

node_memory_SwapFree_bytes 交換分區的空閑大小

 

4. Used Root FS 根文件系統使用率


type: Singlestat
Unit: perent(0-100)
metrics:

100 - ((node_filesystem_avail_bytes{instance=~"$node:$port",job=~"$job",mountpoint="/",fstype!="rootfs"} * 100) / node_filesystem_size_bytes{instance=~"$node:$port",job=~"$job",mountpoint="/",fstype!="rootfs"})

node_filesystem_avail_bytes 文件系統可用空間

 

5. CPU System Load (1m avg) 一分鍾內 CPU 所有內核的平均負載率


type: Singlestat
Unit: perent(0-100)
metrics:

avg(node_load1{instance=~"$node:$port",job=~"$job"}) / count(count(node_cpu_seconds_total{instance=~"$node:$port",job=~"$job"}) by (cpu)) * 100

node_load1 : 系統一分鍾內的負載

 

 

6. CPU System Load (5m avg) 五分鍾內 CPU 所有內核的平均負載率


type: Singlestat
Unit: perent(0-100)
metrics:

avg(node_load5{instance=~"$node:$port",job=~"$job"}) / count(count(node_cpu_seconds_total{instance=~"$node:$port",job=~"$job"}) by (cpu)) * 100

node_load5 : 指5分鍾內cpu的負載

1. CPU Busy :收集所有 cpu 內核 busy 狀態占比



type: Singlestat
Unit: perent(0-100)
(所有 cpu使用情況 - 5分鍾內 cpu 空閑的平均值) / 所有 cpu使用情況
metrics:

(((count(count(node_cpu_seconds_total{instance=~\"$node:$port\",job=~\"$job\"}) by (cpu))) - avg(sum by (mode)(irate(node_cpu_seconds_total{mode='idle',instance=~\"$node:$port\",job=~\"$job\"}[5m])))) * 100) / count(count(node_cpu_seconds_total{instance=~\"$node:$port\",job=~\"$job\"}) by (cpu))


最大值: 100%

2. Used RAM Memory free -m



type: Singlestat
Unit: perent(0-100)
已使用的內存占比(包括Buffer緩存和Cached緩存)
metrics:

((node_memory_MemTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} - node_memory_MemFree_bytes{instance=~\"$node:$port\",job=~\"$job\"}) / (node_memory_MemTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} )) * 100


node_memory_MemFree_bytes 空閑內存

已使用的內存占比(不包括Buffer緩存和Cached緩存)
metrics:

100 - ((node_memory_MemAvailable_bytes{instance=~"$node:$port",job=~"$job"} * 100) / node_memory_MemTotal_bytes{instance=~"$node:$port",job=~"$job"})


MemAvailable: Free + Buffers + Cached - 不可回收的部分。不可回收部分包括:共享內存段,tmpfs,ramfs等

3. Used SWAP: 交換分區使用率



type: Singlestat
Unit: perent(0-100)
metrics:

((node_memory_SwapTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} - node_memory_SwapFree_bytes{instance=~\"$node:$port\",job=~\"$job\"}) / (node_memory_SwapTotal_bytes{instance=~\"$node:$port\",job=~\"$job\"} )) * 100


node_memory_SwapFree_bytes 交換分區的空閑大小

4. Used Root FS 根文件系統使用率



type: Singlestat
Unit: perent(0-100)
metrics:

100 - ((node_filesystem_avail_bytes{instance=~"$node:$port",job=~"$job",mountpoint="/",fstype!="rootfs"} * 100) / node_filesystem_size_bytes{instance=~"$node:$port",job=~"$job",mountpoint="/",fstype!="rootfs"})


node_filesystem_avail_bytes 文件系統可用空間

5. CPU System Load (1m avg) 一分鍾內 CPU 所有內核的平均負載率



type: Singlestat
Unit: perent(0-100)
metrics:

avg(node_load1{instance=~"$node:$port",job=~"$job"}) / count(count(node_cpu_seconds_total{instance=~"$node:$port",job=~"$job"}) by (cpu)) * 100


node_load1 : 系統一分鍾內的負載

6. CPU System Load (5m avg) 五分鍾內 CPU 所有內核的平均負載率



type: Singlestat
Unit: perent(0-100)
metrics:

avg(node_load5{instance=~"$node:$port",job=~"$job"}) / count(count(node_cpu_seconds_total{instance=~"$node:$port",job=~"$job"}) by (cpu)) * 100


node_load5 : 指5分鍾內cpu的負載


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM