一.說明
zabbix自帶很多模板,包含非常多的監控項可以滿足系統層面的大部分要求。
模板有版本要求,有的zabbix-server是4.4版本,但客戶端是3.2版本,可能會導致不支持此項監控,具體可以查看主機-》監控項,盡量讓客戶端和服務端版本一致。
以下是收集的zabbix-5.0上[Template OS Linux by Zabbix agent]模板的監控項,都是根據內容手工翻譯的。推薦頻率屬於比較穩定的,具體根據需求配置。對於機器多的,可以讓部分不重要(不搭配觸發器)的監控項1h采集一次,減緩壓力。
一天 1d 一小時 1h 一分鍾 1m 1秒 1s
二.監控項
基礎監控
| 歸類 | 名稱 | 鍵值 | 推薦頻率 |
|---|---|---|---|
| 客戶端 | zabbix客戶端名稱 | agent.hostname | 1h |
| 客戶端是否ping通 | agent.ping | 1m | |
| 客戶端版本 | agent.version | 1h | |
| 客戶端是否可用 | zabbix[host,agent,available] | 1m | |
| 網絡(ddl) | 網卡類型 | vfs.file.contents["/sys/class/net/{#IFNAME}/type"] | 1h |
| 運行狀態 | vfs.file.contents["/sys/class/net/{#IFNAME}/operstate"] | 1m | |
| 網卡出接口每秒報文被丟棄數 | net.if.out["{#IFNAME}",dropped] | 3m | |
| 網卡進接口每秒報文被丟棄數 | net.if.in["{#IFNAME}",dropped] | 3m | |
| 網卡出接口每秒流量bps | net.if.out["{#IFNAME}"] | 3m | |
| 網卡進接口每秒流量bps | net.if.in["{#IFNAME}"] | 3m | |
| 網卡出接口每秒錯誤數據包數 | net.if.out["{#IFNAME}",errors] | 3m | |
| 網卡進接口每秒錯誤數據包數 | net.if.in["{#IFNAME}",errors] | 3m | |
| 內存 | 系統中總共swap | system.swap.size[,total] | 1h |
| 系統可用swap | system.swap.size[,free] | 1m | |
| 系統可用swap百分比 | system.swap.size[,pfree] | 1m | |
| 系統總共內存 | vm.memory.size[total] | 1h | |
| 系統中可用內存 | vm.memory.size[available] | 1m | |
| 系統可用內存百分比 | vm.memory.size[pavailable] | 1m | |
| 系統中已用內存百分比 | |||
| 系統信息 | 系統主機名 | system.hostname | 1h |
| 系統本地時間 | system.localtime | 1h | |
| 操作系統架構 | system.sw.arch | 1h | |
| 系統版本信息 | system.sw.os | 1h | |
| 系統安裝包信息 | system.sw.packages | 1h | |
| 系統詳細信息 | system.uname | 1h | |
| 系統運行持續時間 | system.uptime | 1h | |
| 系統開機時間 | system.boottime | 1h | |
| 系統配置的最大文件描述符數 | kernel.maxfiles | 1h | |
| 系統配置的最大進程數 | kernel.maxproc | 1h | |
| 系統中總共進程數 | proc.num | 1m | |
| 系統中正在運行的進程數 | proc.num[,,run] | 1m | |
| 登陸用戶數 | system.users.num | 10m | |
| 系統中/etc/passwd文件的md5值 | vfs.file.cksum[/etc/passwd] | 15m | |
| 磁盤(ddl) | 可用inode百分比 | vfs.fs.inode[{#FSNAME},pfree] | 1m |
| 磁盤總共空間 | vfs.fs.size[{#FSNAME},total] | 1m | |
| 磁盤已用空間 | vfs.fs.size[{#FSNAME},used] | 1m | |
| 磁盤已用空間百分比 | vfs.fs.size[{#FSNAME},pused] | 1m | |
| cpu | 系統cpu的1分鍾負載 | system.cpu.load[all,avg1] | 1m |
| 系統cpu的5分鍾負載 | system.cpu.load[all,avg5] | 1m | |
| 系統cpu的15分鍾內負載 | system.cpu.load[all,avg15] | 1m | |
| 系統cpu核心數 | system.cpu.num | 1h | |
| 系統cpu每秒中斷數 | system.cpu.intr | 1m | |
| 系統cpu的每秒上下文切換數 | system.cpu.switches | 1m | |
| 系統cpu用戶空間使用百分比 | system.cpu.util[,user] | 1m | |
| 系統cpu的io操作使用百分比 | system.cpu.util[,iowait] | 1m | |
| 系統cpu的硬中斷使用百分比 | system.cpu.util[,interrupt] | 1m | |
| 系統cpu的空閑時間占用百分比 | system.cpu.util[,idle] | 1m | |
| 系統cpu的軟中斷使用百分比 | system.cpu.util[,softirq] | 1m | |
| 系統cpu系統空間使用百分比 | system.cpu.util[,system] | 1m | |
| 系統cpu虛擬化使用百分比 | system.cpu.util[,steal] | 1m | |
| 系統cpu進程優先級變更使用的百分比 | system.cpu.util[,nice] | 1m | |
