項目實戰——企業級Zabbix監控實戰（一）

本文轉載自查看原文 2017-12-02 11:55 10795

項目實戰——企業級Zabbix監控實戰

實驗一：Zabbix監控的搭建

1、實驗准備

　　centos系統服務器3台、一台作為監控服務器，兩台台作為被監控節點，配置好yum源、防火牆關閉、各節點時鍾服務同步、各節點之間可以通過主機名互相通信。
1）所有機器關閉防火牆和selinux

	iptables -F && setenforing

2）根據架構圖，實驗基本設置如下：

2、Zabbix的安裝

1）更新我們的yum倉庫

　　我們去官網下載一個包zabbix-release-3.4-2.el7.noarch.rpm，本地安裝至我們的虛擬機，這樣，我們本地就有了新的yum源，可以直接安裝zabbix服務：

wget http://repo.zabbix.com/zabbix/3.4/rhel/7/x86_64/zabbix-release-3.4-2.el7.noarch.rpm

　　下載到本地以后，我們直接安裝：

rpm -ivh zabbix-release-3.4-2.el7.noarch.rpm

　　而后更新我們的yum倉庫：

[root@server ~]# yum repolist 
Loaded plugins: fastestmirror, langpacks  
Loading mirror speeds from cached hostfile
zabbix-non-supported                                                      4/4
repo id                     repo name                                   status
base                        base                                         9,363
epel                        epel                                        11,349
zabbix/x86_64               Zabbix Official Repository - x86_64             80
zabbix-non-supported/x86_64 Zabbix Official Repository non-supported -       4
repolist: 20,796

　　由於我配置的epel源中，也有zabbix的包，但是版本很舊了，為了不沖突，我們在配置文件中把epel源注釋掉，然后再來查看我們的yum倉庫：

[root@server ~]# vim /etc/yum.repos.d/base.repo
	[base]
	name=base
	baseurl=file:///misc/cd
	gpgcheck=0

	#[epel]
	#name=epel
	#baseurl=http://172.17.0.1/fedora-epel/7/x86_64/
	#gpgcheck=0
[root@server ~]# yum repolist
Loaded plugins: fastestmirror, langpacks
Loading mirror speeds from cached hostfile
repo id                     repo name                                    status
base                        base                                         9,363
zabbix/x86_64               Zabbix Official Repository - x86_64             80
zabbix-non-supported/x86_64 Zabbix Official Repository non-supported - x     4
repolist: 9,447

　　現在，我們去安裝包就可以了：

[root@node1 ~]# yum -y install zabbix-agent zabbix-get zabbix-sender zabbix-server-mysql zabbix-web zabbix-web-mysql

　　安裝完成，本步驟完成。

2）設置數據庫：

　　首先，我們修改一下配置文件——/etc/my.cnf.d/server.cnf：

[root@server ~]# vim /etc/my.cnf.d/server.cnf
	[mysqld]
	skip_name_resolve = ON			#跳過主機名解析
	innodb_file_per_table = ON		#
	innodb_buffer_pool_size = 256M	#緩存池大小
	max_connections = 2000			#最大連接數

	log-bin = master-log			#開啟二進制日志

　　重啟我們的數據庫服務：

[root@server ~]# systemctl restart mariadb

　　創建數據庫並授權賬號

MariaDB [(none)]> create database zabbix character set 'utf8';
MariaDB [(none)]> grant all on zabbix.* to 'zbxuser'@'192.168.37.%' identified by 'keer';
MariaDB [(none)]> flush privileges;				#刷新授權

　　導入表
　　首先，我們來查看一下，zabbix-server-mysql這個包提供了什么：

[root@server ~]# rpm -ql zabbix-server-mysql
/etc/logrotate.d/zabbix-server
/etc/zabbix/zabbix_server.conf
/usr/lib/systemd/system/zabbix-server.service
/usr/lib/tmpfiles.d/zabbix-server.conf
/usr/lib/zabbix/alertscripts
/usr/lib/zabbix/externalscripts
/usr/sbin/zabbix_server_mysql
/usr/share/doc/zabbix-server-mysql-3.2.6
/usr/share/doc/zabbix-server-mysql-3.2.6/AUTHORS
/usr/share/doc/zabbix-server-mysql-3.2.6/COPYING
/usr/share/doc/zabbix-server-mysql-3.2.6/ChangeLog
/usr/share/doc/zabbix-server-mysql-3.2.6/NEWS
/usr/share/doc/zabbix-server-mysql-3.2.6/README
/usr/share/doc/zabbix-server-mysql-3.2.6/create.sql.gz		#生成表的各種腳本
/usr/share/man/man8/zabbix_server.8.gz
/var/log/zabbix
/var/run/zabbix

　　我們來使用這個文件生成我們所需要的表：

[root@server ~]# gzip -d create.sql.gz
[root@server ~]# head  create.sql 			#查看一下表頭
CREATE TABLE `users` (
	`userid`                 bigint unsigned                           NOT NULL,
	`alias`                  varchar(100)    DEFAULT ''                NOT NULL,
	`name`                   varchar(100)    DEFAULT ''                NOT NULL,
	`surname`                varchar(100)    DEFAULT ''                NOT NULL,
	`passwd`                 char(32)        DEFAULT ''                NOT NULL,
	`url`                    varchar(255)    DEFAULT ''                NOT NULL,
	`autologin`              integer         DEFAULT '0'               NOT NULL,
	`autologout`             integer         DEFAULT '900'             NOT NULL,
	`lang`                   varchar(5)      DEFAULT 'en_GB'           NOT NULL,

　　我們查看表頭發現沒有創建數據庫的命令，這也正是我們剛剛手動創建數據庫的原因。
　　然后，我們直接把這個表導入至我們的數據庫即可：

[root@server ~]# mysql -uzbxuser -h192.168.37.111 -p zabbix < create.sql 
Enter password:

　　導入以后，我們進去數據庫查看一下：

[root@server ~]# mysql -uzbxuser -h192.168.37.111 -p
Enter password:
MariaDB [(none)]> show databases;
+--------------------+
| Database           |
+--------------------+
| information_schema |
| test               |
| zabbix             |
+--------------------+
MariaDB [(none)]> use zabbix;
Database changed
MariaDB [zabbix]> show tables;
+----------------------------+
| Tables_in_zabbix           |
+----------------------------+
| acknowledges               |
| actions                    |
| alerts                     |
……
| usrgrp                     |
| valuemaps                  |
+----------------------------+
127 rows in set (0.00 sec)

　　可以看出來，我們的數據已經導入成功了。
　　

3、配置 server 端

　　我們的數據庫准備好了以后，我們要去修改server端的配置文件。

[root@server ~]# cd /etc/zabbix/
[root@server zabbix]# ls
web  zabbix_agentd.conf  zabbix_agentd.d  zabbix_server.conf
#為了方便我們以后恢復，我們把配置文件備份一下
[root@server zabbix]# cp zabbix_server.conf{,.bak}
[root@server zabbix]# vim zabbix_server.conf
ListenPort=10051			#默認監聽端口
SourceIP=192.168.37.111		#發采樣數據請求的IP

　　為什么要設置SourceIP，由於我們的客戶端可能一個主機多個IP，我們又不能允許任意的IP都能從我們這里讀取數據，就會有一個驗證方式，而該方式是基於識別SourceIP來實現的。

　　日志，默認用文件記錄，也可以發送給我們的rsyslog日志記錄系統，如果我們選擇默認，則日志存放在LogFile=/var/log/zabbix/zabbix_server.log中，也可以自己設置。

　　日志的滾動。默認值為1，表示滾動。我們設為0則表示不滾動。當數據特別多的時候，我們也可以設置成為1，然后在Maximum size of log file in MB設置當數據文件最大到多少時會自動滾動。

　　日志的級別。一共有6個級別。我們可以根據自己的需要來設置級別。其中0表示輸出最少的信息，5表示輸出最詳細的信息，默認值為3，設置為3的話就表示，0、1、2、3四個級別都顯示。考慮到生產系統中的壓力時，這里的信息，如果沒有必要的話，越簡單越好，只要在出錯的時候，我們可以依據其進行排錯即可。

	DBHost=192.168.37.111		#數據庫對外的主機
	DBName=zabbix				#數據庫名稱
	DBUser=zbxuser				#數據庫用戶
	DBPassword=keer				#數據庫密碼
	DBPort=3306					#數據庫啟動端口

　　數據庫相關的設置。

補充：我們可以使用grep -i "^####" zabbix_server.conf來查看配置文件中有哪些大段，也可以使用grep -i "^###" zabbix_server.conf來查看配置文件中每一段中的配置項有哪些

　　以上，我們的基本配置已經完成，可以開啟服務了：

[root@server zabbix]# systemctl start zabbix-server.service

　　開啟服務以后，我們一定要去確認一下我們的端口有沒有開啟：

[root@server zabbix]# ss -nutl |grep 10051
tcp    LISTEN     0      128       *:10051                 *:*                  
tcp    LISTEN     0      128      :::10051                :::*

　　如果查到的端口沒有開啟，我們就要去檢查一下配置文件有沒有出問題了。
　　至此，我們server端的進程啟動已經ok了，接下來就可以使用web GUI來打開接口進行設定了
　　

4、配置 web GUI

　　我們先來查看一下，我們web GUI的配置文件在哪里：

[root@server ~]# rpm -ql zabbix-web | less
/etc/httpd/conf.d/zabbix.conf
/etc/zabbix/web
/etc/zabbix/web/maintenance.inc.php
/etc/zabbix/web/zabbix.conf.php
/usr/share/doc/zabbix-web-3.2.6
/usr/share/doc/zabbix-web-3.2.6/AUTHORS
/usr/share/doc/zabbix-web-3.2.6/COPYING
/usr/share/doc/zabbix-web-3.2.6/ChangeLog
/usr/share/doc/zabbix-web-3.2.6/NEWS
/usr/share/doc/zabbix-web-3.2.6/README
……

　　可以看出，有一個/etc/httpd/conf.d/zabbix.conf文件，這個配置文件就是幫我們做映射的文件，我們可以去看一看這個文件：

Alias /zabbix /usr/share/zabbix		#我們訪問的時候要在主機后加上/zabbix來訪問我們這個服務

　　時區是一定要設置的，這里被注釋掉是因為，我們也可以在php的配置文件中設置時區，如果我們在php配置文件中設置時區，則對所有的php服務均有效，如果我們在zabbix.conf中設置時區，則僅對zabbix服務有效。所以，我們去php配置文件中設置我們的時區：

vim /etc/php.ini
	[Date]
	; Defines the default timezone used by the date functions
	; http://php.net/date.timezone
	date.timezone = Asia/Shanghai

　　接下來，我們就可以啟動我們的httpd服務了：

　　我們的服務已經開啟，接着我們就可以用瀏覽器來訪問了。

5、瀏覽器訪問並進行初始化設置

　　我們使用瀏覽器訪問192.168.37.111/zabbix，第一次訪問時需要進行一些初始化的設置，我們按照提示操作即可：

　　點擊Finish以后，我們就會跳轉到登錄頁面，使用我們的賬號密碼登錄即可：

　　默認用戶名為：admin ，密碼為：zabbix 。
　　登陸進來就可以看到我們的儀表盤了：

6、配置 agent 端

　　當我們把監控端配置啟動以后，我們需要來設置一下我們的監控端，我們在被監控的主機安裝好agent，設置好他的server，並把他添加到server端，就能將其納入我們的監控系統中去了。

1）安裝zabbix

　　同樣的，我們先來安裝zabbix。下載包，注釋epel源，安裝所需的包。具體步驟如下：

[root@node1 ~]# wget http://repo.zabbix.com/zabbix/3.4/rhel/7/x86_64/zabbix-release-3.4-2.el7.noarch.rpm
[root@node1 ~]# rpm -ivh zabbix-release-3.4-2.el7.noarch.rpm 
[root@node1 ~]# vim /etc/yum.repos.d/centos7.repo 
[base]
name=base
baseurl=http://172.17.0.1/centos/7/
gpgcheck=0

#[epel]
#name=epel
#baseurl=http://172.17.0.1/fedora-epel/7/x86_64/
#gpgcheck=0
[root@node1 ~]# yum install zabbix-agent zabbix-sender -y

　　安裝完成以后，我們去修改配置文件。

2）修改配置文件

　　一樣的，我們先查一下包內有什么：

[root@node1 zabbix]# rpm -ql zabbix-agent 
/etc/logrotate.d/zabbix-agent
/etc/zabbix/zabbix_agentd.conf
/etc/zabbix/zabbix_agentd.d
/etc/zabbix/zabbix_agentd.d/userparameter_mysql.conf
/usr/lib/systemd/system/zabbix-agent.service
/usr/lib/tmpfiles.d/zabbix-agent.conf
/usr/sbin/zabbix_agentd
/usr/share/doc/zabbix-agent-3.4.4
/usr/share/doc/zabbix-agent-3.4.4/AUTHORS
/usr/share/doc/zabbix-agent-3.4.4/COPYING
/usr/share/doc/zabbix-agent-3.4.4/ChangeLog
/usr/share/doc/zabbix-agent-3.4.4/NEWS
/usr/share/doc/zabbix-agent-3.4.4/README
/usr/share/man/man8/zabbix_agentd.8.gz
/var/log/zabbix
/var/run/zabbix

　　對配置文件做一個備份，然后去修改配置文件：

[root@node1 ~]# cd /etc/zabbix/
[root@node1 ~]# cd /etc/zabbix/
[root@node1 zabbix]# ls
zabbix_agentd.conf  zabbix_agentd.d
[root@node1 zabbix]# cp zabbix_agentd.conf{,.bak}
[root@node1 zabbix]# vim zabbix_agentd.conf

　　重點需要修改的仍然是GENERAL PARAMETERS段：

　　是否允許別人執行遠程操作命令，默認是禁用的，打開的話會有安全風險。

Server=192.168.37.111		#指明服務器是誰的
ListenPort=10050			#自己監聽的端口
ListenIP=0.0.0.0			#自己監聽的地址，0.0.0.0表示本機所有地址
StartAgents=3				#優化時使用的

ServerActive=192.168.37.111	#主動監控時的服務器
Hostname=node1.keer.com		#自己能被server端識別的名稱

　　修改完成之后，我們保存退出。然后就可以啟動服務了：

[root@node1 zabbix]# systemctl start zabbix-agent.service

　　照例查看端口是否已開啟

[root@node1 zabbix]# ss -ntul |grep 10050
tcp    LISTEN     0      128       *:10050                 *:*

　　已經開啟成功。接着，我們就可以去server端添加了。
　　node2也進行同樣的操作，唯一不同的就是配置文件中的Hostname要設為node2.keer.com。
　　

7、監控過程詳解

1）修改密碼及中文版

　　作為一只英語不好的程序媛，小編在這里悄悄改成了中文版0.0如果大家英語好的話看英文版即可，英語不好就像小編一樣改了吧，畢竟中文版比較適合初學者更快的學習~

　　按如上操作即可，選擇中文以后，點擊下面的update即可更新成功，更新過后是這樣嬸兒的~

　　同樣的，為了安全起見，我們把密碼改掉：

　　修改完成后同樣點擊更新即可。

2）創建主機及主機群組

　　我們先來定義一個主機群組：

　　然后我們就可以去添加主機了：

　　當然，上面有很多選擇卡，有一個加密：

　　設置完成后，點擊添加。我們就可以看到，我們添加的這個主機已經出現在列表中了：

　　同樣的，我們把node2節點也添加進來：

3）監控項(items)

① 介紹

　　我們點擊上圖中node1的監控項，即可創建我們的監控項，首先，我們創建三個應用集：

　　然后我們來定義監控項：

　　任何一個被監控項，如果想要能夠被監控，一定要在zabbix-server端定義了能夠連接至zabbix-agent端，並且能夠獲取命令。或者在agent端定義了能夠讓server端獲取命令。一般都是內建的命令，都對應的有其名字，被我們稱之為key。

　　關於key值，我們可以直接在網頁上設置(服務器自動執行)，也可以使用命令行命令(手動執行)來獲取：

[root@server ~]# zabbix_get -s 192.168.37.122 -p 10050 -k "system.cpu.intr"
　　在我們的agent端，也可以使用命令來查看intr的速率變化：

　　我們繼續來看我們的監控項：

　　說了這么多，我們來簡單定義一個：

② 定義一個不帶參數的監控項

　　設置完以后，點擊更新，即可加入，並會自動跳轉至下圖頁面：

　　定義完成，我們回到所有主機，等待5秒，我們可以看到，我們node1節點后面的選項已經有變成綠色的了：

　　我們也可以回到我們的儀表盤，可以看到，我們的監控項有一個處於啟用狀態：

　　那么，我們的數據在哪里呢？可以點擊最新數據，把我們的node1節點添加至主機，應用一下，就可以看到下面的狀態了：

　　可以看到，我們還有一個圖形頁面，點進去則可以看圖形的分布：

　　事實上，我們關注的指標有很多種，我們一一添加進來即可。
　　剛剛我們定義的監控項是很簡單的，指定一個key即可，但是有些監控項是帶有參數的，這樣一來，我們的監控項就有更多的靈活性。接下來，我們來簡單說明一個需要帶參數的監控項：

③ 定義一個帶參數的監控項

　　圖中的[]就是需要參數的意思，里面的值即為參數，帶<>為不可省略的。我們就以這個例子來說明：
　　if表示是接口名；<mode>表示是那種模式，包括但不限於：packets(包)、bytes(字節)、errors(錯誤)、dropped(丟包)、overuns等等（上述內容通過ifconfig查看）
　　我們來設置一下這個監控值：

　　同樣的，我們也可以通過命令行來查看：

[root@server ~]# zabbix_get -s 192.168.37.122 -p 10050 -k "net.if.in[ens33,packets]"

　　我們來看看網頁的顯示情況：檢測中 ---> 最新數據 ---> Network Interface Stats(圖形)

④ 快速定義類似指標

　　如果我們想要定義一個類似的指標，我們可以直接選擇克隆，然后簡單的修改一點點參數即可。
　　就以我們剛剛定義的net.if.in[ens33,packets]為例，如果我們想要在定義一個out的進行如下操作即可：

　　如果我們要以字節為單位也要定義的話，進行同樣的操作：

　　如果有需要的話也可以把byte再克隆成out。就不一一演示了~
　　可以看一下，我們現在已經定義的指標：

　　我們來到檢測中 ---> 最新數據，可以看到，我們定義的監控項都已經有值了：

⑤ 刪除監控項

　　如果有一個監控項，我們用不上了，就可以刪除掉。但是如果你直接刪除的話，默認數據是會留下的，所以我們要先清除數據，然后再刪除，具體操作步驟如下：

⑥ 監控項存儲的值

　　對於監控項存儲的值，老一點的版本只有以下三種方式：

As is：不對數據做任何處理(存儲的為原始值)
Delta：（simple change)(變化)，本次采樣減去前一次采樣的值的結果
Delta：（speed per second)(速率)，本次采樣減去前一次采樣的值，再除以經過的時長；
　　而在3.4版本以后有了更多的表現形式：

4）觸發器（trigger）

① 簡介

　　當我們的采集的值定義完了以后，就可以來定義觸發器了。
　　我們觸發器的定義是：界定某特定的item采集到的數據的非合理區間或非合理狀態。通常為邏輯表達式。
　　邏輯表達式（閾值）：通常用於定義數據的不合理區間，其結果如下：
　　OK(不符合條件)：正常狀態 --> 較老的zabbix版本，其為FALSE；
　　PROBLEM(符合條件)：非正常狀態 --> 較老的zabbix版本，其為TRUE；
　　一般，我們評定采樣數值是否為合理區間的比較穩妥的方法是——根據最后N次的平均值來判定結果；這個最后N次通常有兩種定義方式：

最近N分鍾所得結果的平均值
最近N次所得結果的平均值

　而且，我們的觸發器存在可調用的函數：

nodata()　　　　#是否采集到數據，采集不到則為異常
last()　　　　　 #最近幾次的平均值
date()
time()
now()
dayofmonth()
...

　　注：能用數值保存的就不要使用字符串

② 觸發器表達式

　　基本的觸發器表達式格式如下所示

{<server>:<key>.<function>(<parameter>)}<operator><constant>

server：主機名稱；
key：主機上關系的相應監控項的key；
function：評估采集到的數據是否在合理范圍內時所使用的函數，其評估過程可以根據采取的數據、當前時間及其它因素進行；
目前，觸發器所支持的函數有avg、count、change、date、dayofweek、delta、diff、iregexp、last、max、min、nodata、now、sum等
parameter：函數參數；大多數數值函數可以接受秒數為其參數，而如果在數值參數之前使用“#”做為前綴，則表示為最近幾次的取值，如sum(300)表示300秒內所有取值之和，而sum(#10)則表示最近10次取值之和；
此外，avg、count、last、min和max還支持使用第二個參數，用於完成時間限定；例如，max(1h,7d)將返回一周之前的最大值；
　　表達式所支持的運算符及其功能如下圖所示：

③ 定義一個觸發器

　　我們可以查看一下rate of packets(in)的值，並以其為標准確定我們的非正常的值：

　　圖中我們可以看出，我們的最大值為74，最小值為4，平均值為24。這樣的話，我們可以定義50以上的都是非正常的值。
　　下面我們來定義一個觸發器：
　　進入：配置 ---> 主機 ---> node1 ---> 觸發器 ---> 創建觸發器

　　我們的表達式可以直接點擊右側的添加，然后定義自己所需的內容，即可自動生成：

　　生成完畢后，我們就點擊頁面下方的添加，即成功定義了一個觸發器，同時頁面自動跳轉：

　　然后我們去看一下我們剛剛定義了觸發器的那個監控項：

　　我們可以看出，這個里面就有了一根線，就是我們剛剛定義的值，超過線的即為異常狀態，看起來非常直觀。
　　但是，現在即使超過了這根線，也僅僅會產生一個觸發器事件而不會做其他任何事。因此，我們就需要去定義一個動作(action)。

④ 觸發器的依賴關系

　　我們的觸發器彼此之間可能會存在依賴關系的，一旦某一個觸發器被觸發了，那么依賴這個觸發器的其余觸發器都不需要再報警。
　　我們可以來試想一下這樣的場景：
　　我們的多台主機是通過交換機的網絡連接線來實現被監控的。如果交換機出了故障，我們的主機自然也無法繼續被監控，如果此時，我們的所有主機統統報警……想想也是一件很可怕的事情。要解決這樣的問題，就是定義觸發器之間的依賴關系，當交換機掛掉，只它自己報警就可以了，其余的主機就不需要在報警了。這樣，也更易於我們判斷真正故障所在。
　　注意：目前zabbix不能夠直接定義主機間的依賴關系，其依賴關系僅能通過觸發器來定義。
　　我們來簡單舉一個例子，示范一下如何定義一個依賴關系：
　　打開任意一個觸發器，上面就有依賴關系，我們進行定義即可：

　　由於當前我們只定義了一個觸發器，就不演示了，過程就是這樣~添加以后點擊更新即可。
　　觸發器可以有多級依賴關系，比如我們看下面的例子：

5）定義動作（action）

① 簡介

　　我們需要去基於一個對應的事件為條件來指明該做什么事，一般就是執行遠程命令或者發警報。
　　我們有一個告警升級的機制，所以，當發現問題的時候，我們一般是先執行一個遠程操作命令，如果能夠解決問題，就會發一個恢復操作的訊息給接收人，如果問題依然存在，則會執行發警報的操作，一般默認的警報接收人是當前系統中有的zabbix用戶，所以當有人需要收到警報操作的話，我們則需要把它加入我們的定義之中。
　　其次，每一個用戶也應該有一個接收告警信息的方式，即媒介，就像我們接收短信是需要有手機號的一樣。
　　我們的每一個監控主機，能夠傳播告警信息的媒介有很多種，就算我們的每一種大的媒介，能夠定義出來的實施媒介也有很多種。而對於一個媒介來說，每一個用戶都有一個統一的或者不同的接收告警信息的端點，我們稱之為目標地或者目的地。
　　綜上，為了能夠發告警信息，第一，我們要事先定義一個媒介，第二，還要定義這個媒介上用戶接收消息的端點（當然，在用戶上，我們也稱之為用戶的媒介）。
　　我們可以去看一下系統內建的媒介類型：

　　這只是大的媒介類型，里面還有更多的細分，我們以Email為例：

　　同樣的，同一個類型我們也可以定義多個，還是以Email為例，我們可以定義一個騰訊的服務器，一個網易的服務器，一個阿里的服務器等等。

② 定義一個媒介（media）

　　我們還是以Email為例。來簡單的定義一個媒介：

　　這樣定義以后，我們去更新一下就可以了。
　　媒介定義好了，那么我們怎么才能夠然后用戶接收到郵件呢？比如讓我們的Admin用戶接收郵件，我們應該怎么操作呢？具體步驟如下：
　　進入管理 ---> 用戶 ---> Admin ---> 報警媒介
　　我們來添加一條進來：

　　添加過后是這樣的：

　　然后我們更新就可以了。
　　一個用戶可以添加多個接收的媒介類型。

③ 定義一個動作（action）

　　我們之前說過了，動作是在某些特定條件下觸發的，比如，某個觸發器被觸發了，就會觸發我們的動作。
　　現在，我么基於redis來定義一個動作。
　　首先，我們在agent端使用yum安裝一下redis：

[root@node1 ~]# yum install redis -y

　　修改一下配置文件：

[root@node1 ~]# vim /etc/redis.conf 
bind 0.0.0.0		#不做任何認證操作

　　修改完成以后，我們啟動服務，並檢查端口：

[root@node1 ~]# systemctl start redis
[root@node1 ~]# ss -nutlp | grep redis
tcp    LISTEN     0      128       *:6379                  *:*                   users:(("redis-server",pid=5250,fd=4))

　　接着，我們就可以去網站上來定義相關的操作了：

1.定義監控項

　　進入配置 ---> 主機 ---> node1 ---> 監控項（items）---> 創建監控項

　　填寫完畢以后，我們點擊下方的添加。

　　該監控項已成功添加。
　　我們可以去查看一下他的值：
　　檢測中 ---> 最新數據

2.定義觸發器

　　定義好了監控項以后，我們亦可來定義一個觸發器，當服務有問題的時候，我們才能及時知道：
　　進入配置 ---> 主機 ---> node1 ---> 觸發器（trigger）---> 創建觸發器

　　填寫完畢以后，我們點擊下方的添加。

　　該觸發器已成功添加。
　　我們去查看一下：
　　監測中 ---> 最新數據

　　我們來手動關閉redis服務來檢測一下：

[root@node1 ~]# systemctl stop redis.service

　　進入監測中 ---> 問題

　　可以看到，現在已經顯示的是問題了。並且有持續的時間，當我們的服務被打開，會轉為已解決狀態：

[root@node1 ~]# systemctl start redis.service

3.定義動作（action）

　　現在我們就可以去定義action了。
　　進入配置 ---> 動作 ---> 創建動作（注意選擇事件源為觸發器）

　　我們可以進行操作添加：

　　我們可以看出，還需要在虛擬機上進行兩項操作，一是修改sudo配置文件使zabbix用戶能夠臨時擁有管理員權限；二是修改zabbix配置文件使其允許接收遠程命令。我們進行如下操作：

[root@node1 ~]# visudo			#相當於“vim /etc/sudoers”
	## Allow root to run any commands anywhere
	root    ALL=(ALL)   ALL
	zabbix    ALL=(ALL)   NOPASSWD: ALL		#添加的一行，表示不需要輸入密碼

[root@node1 ~]# vim /etc/zabbix/zabbix_agentd.conf
	EnableRemoteCommands=1			#允許接收遠程命令
	LogRemoteCommands=1				#把接收的遠程命令記入日志

[root@node1 ~]# systemctl restart zabbix-agent.service

　　我們添加了第一步需要做的事情，也就是重啟服務，如果重啟不成功怎么辦呢？我們就需要來添加第二步：

　　添加完成以后，我們可以看一下：

　　操作添加完了，如果服務自動恢復了，我們可以發送消息來提示：

　　至此，我們的動作設置完畢，可以點擊添加了，添加完成會自動跳轉至如下頁面：

　　現在我們可以手動停止服務來進行測試：

[root@node1 ~]# systemctl stop redis.service

　　然后我們來到問題頁面來查看，發現確實有問題，並且已經解決：

　　我們可以去server端查看是否收到郵件：

　　也可以去agent端查看端口是否開啟：

[root@node1 ~]# systemctl stop redis.service 
[root@node1 ~]# ss -ntl
State       Recv-Q Send-Q Local Address:Port               Peer Address:Port              
LISTEN      0      128        *:6379                   *:*                  
LISTEN      0      128        *:111                    *:*                  
LISTEN      0      5      192.168.122.1:53                     *:*                  
LISTEN      0      128        *:22                     *:*                  
LISTEN      0      128    127.0.0.1:631                    *:*                  
LISTEN      0      128        *:23000                  *:*                  
LISTEN      0      100    127.0.0.1:25                     *:*                  
LISTEN      0      128        *:10050                  *:*                  
LISTEN      0      128       :::111                   :::*                  
LISTEN      0      128       :::22                    :::*                  
LISTEN      0      128      ::1:631                   :::*                  
LISTEN      0      100      ::1:25                    :::*

　　可以看出端口正常開啟，我們的動作觸發已經完成。

補充：我們也可以使用腳本來發送警報，我們的腳本存放路徑在配置文件中可以找到，定義為：AlterScriptsPath=/usr/lib/zabbix/alertscripts

　　接下來，我們來一波徹底一點的操作，我們來手動修改一下redis服務的監聽端口，這樣，我們就不能通過重啟服務恢復了：

[root@node1 ~]# vim /etc/redis.conf
	#port 6379
	port 6380				#注釋掉原來的端口，更換為新的端口

[root@node1 ~]# systemctl restart redis

　　然后，我們來網頁查看一下狀態：
　　進入監測中 ---> 問題，可以看到是報錯的：

　　這樣，在經過了重啟服務以后還是沒能把解決問題，就會發郵件告警：

　　我們再把服務端口改回來，然后重啟服務。這樣，等到問題自動解決了以后，我們會再次收到郵件：

　　這樣，我們的動作設定已經全部測試完成。
　　

6）zabbix可視化

① 簡介

　　數據日積月累，如果我們想要更直觀的了解到各項數據的情況，圖形無疑是我們的最佳選擇。
　　zabbix提示了眾多的可視化工具提供直觀展示，如graph、screen及map等。上文中我們也看到過一些簡單的圖形展示。
　　如果我們想要把多個相關的數據定義在同一張圖上去查看，就需要去自定義圖形了~

② 自定義圖形（Graphs）

　　自定義圖形中可以集中展示多個時間序列的數據流。支持“線狀圖(normal)”、“堆疊面積圖(stacked)”、“餅圖(pie)” 和“分離型餅圖(exploded)”四種不同形式的圖形。
　　具體的設置過程如下：
　　進入配置 ---> 主機 ---> node1 ---> 圖形，選擇右上角創建圖形：

　　我們來看一看四種狀態：

　　包括我們的主機都可以自定義，不過一般來說，線型是看的最清晰的，我們通常會使用這個。
　　我們也可以克隆一個packets來更改為bytes用~同樣的，我們如果想添加別的內容，也都可以添加的。
　　我們一共添加了三個圖形，我們可以在監測中 ---> 圖形來查看

③ 聚合圖形（Screens）

　　我們創建的自定義圖形也可以放在一個聚合圖里顯示，具體的設置方法如下：
　　進入監測中 ---> 聚合圖形 ---> 選擇右上角創建聚合圖形

　　我們還可以選擇分享：

　　定義好了添加即可。
　　定義完成以后，我們需要編輯一下，來指定保存哪些圖：

　　依次添加即可，添加完成之后是這樣嬸兒的~：

　　因為我們只有三張圖，所以添加的有重復的，通常情況下是不需要這樣的。

④ 幻燈片演示（Slide shows）

　　如果我們有多個聚合圖形想要按順序展示的話，我們就可以定義一個幻燈片。
　　具體步驟如下：
　　進入監測中 ---> 聚合圖形 ---> 右上角選擇幻燈片演示 ---> 創建幻燈片

　　然后我們打開即可。打開以后顯示的是圖片1，5s以后會自動切換為圖片2。
　　這樣就可以實現幻燈片演示，我們就不需要去手動切換了。

⑤ 定義拓撲圖（Maps）

　　在拓撲圖中，我們可以定義成一個復雜的網絡連接圖，我們可以使用一台主機來連接另一台主機，這樣的話，我們就可以查看出到底是哪個鏈接出了問題。
　　我們就不來演示了，看一下過程即可：
　　進入監測中 ---> 拓撲圖 ---> 所有地圖 ---> Local network(默認就有的)

　　通過 Ping 和 Traceroute 就可以實驗我們上述的功能。

7）模板

① 創建模板

　　之前我們說過，每一個主機的監控項都很多，我們一個一個的添加實在是太頭疼了，更何況，可能不止一個主機。
　　但是我們可以把一個redis的監控項添加進一個模板里，這樣更方便於我們以后的添加。
　　具體操作如下：
　　進入配置 ---> 模板 ---> 選擇右上角創建模板

　　填寫完以后，我們點擊下方的添加即可。
　　我們可以基於組過濾一下，就能看到我們剛剛定義的模板：

　　一樣的，我們可以向里面添加應用集、監控項、觸發器、圖形等等，添加完成以后，后期我們再有主機需要添加就直接套用模板即可。
　　需要注意的一點是，我們現在添加的是模板，所以不會立即采用數據，只有鏈接到主機上以后，才會真正生效。

② 模板的導入與導出

　　我們也可以直接導入一個模板，在互聯網上可以找到很多，導入的步驟如下：

　　同樣的，我們創建好的模板也可以導出為文件：
　　我們任意選中一個准備好的模板，然后頁面的最下方就有導出按鈕：

　　因此，我們就可以非常方便的進行應用了~

③ 模板的應用

　　我們的軟件已經創建了許多模板，我們可以使用一個模板來看看效果。
　　進入配置 ---> 主機 ---> node1 ---> 模板
　　我們就可以選擇要添加的模板了：

　　到這里我們就可以點擊更新了。一旦我們成功鏈接至模板，我們的主機數據就會更新了：

　　注意：1、一個主機可以鏈接多個模板，但盡量不要讓一個指標被采樣兩次。
　　2、如果我們有多個主機，同時這些主機也在一個主機組里，這樣的話，我們只需要在這個主機組里添加模板，就能夠讓在主機組里的所有主機進行tongb

④ 移除模板鏈接

　　當我們一個主機的模板不想要用了，我們就可以移除模板鏈接，具體操作步驟如下：
　　進入配置 ---> 主機 ---> node1 ---> 模板
　　我們就可以把不需要的模板移除：

　　我們來刪除掉試試看，移除並清理以后，我們點擊更新。就會自動跳轉至如下界面：

　　可以看出，我們的模板已經被移除了。

8）宏（macro）

① 簡介

　　宏是一種抽象(Abstraction)，它根據一系列預定義的規則替換一定的文本模式，而解釋器或編譯器在遇到宏時會自動進行這一模式替換。
　　類似地，zabbix基於宏保存預設文本模式，並且在調用時將其替換為其中的文本。
　　zabbix有許多內置的宏，如{HOST.NAME}、{HOST.IP}、{TRIGGER.DESCRIPTION}、{TRIGGER.NAME}、{TRIGGER.EVENTS.ACK}等。
　　詳細信息請參考官方文檔
　　

② 級別

　　宏一共有三種級別，分別是全局宏、模板宏、主機宏。
　　不同級別的宏的適用范圍也不一樣。

全局宏也可以作用於所有的模板宏和主機宏，優先級最低。
模板宏則可以作用於所有使用該模板的主機，優先級排在中間。
主機宏則只對單個主機有效，優先級最高。

③ 類型

　　宏的類型分為系統內建的宏和用戶自定義的宏。
　　為了更強的靈活性，zabbix還支持在全局、模板或主機級別使用用戶自定義宏(user macro)。
　　系統內建的宏在使用的時候需要{MACRO}的語法格式，用戶自定義宏要使用{$MACRO}這種特殊的語法格式。
　　宏可以應用在item keys和descriptions、trigger名稱和表達式、主機接口IP/DNS及端口、discovery機制的SNMP協議的相關信息中……
　　宏的名稱只能使用大寫字母、數字及下划線。
　　進一步信息請參考官方文檔。

④ 定義一個宏

　　如果我們想要在我們的監控項(items)上使用宏，我們就要先去定義一個宏，然后去創建監控項，直接引用定義好的宏即可。具體操作步驟如下：

1.定義全局宏

　　進入管理 ---> 一般 ---> 右上角選擇宏

　　這樣，我們的全局宏就添加好了。

2.定義監控項，調用宏

　　進入配置 ---> 主機 ---> 所有主機 ---> 監控項 ---> 右上角創建監控項

　　填寫完成以后，點擊添加。然后我們就可以看到這個調用宏的監控項已經添加成功：

　　我們可以來查看一下這個監控項現在的狀態：
　　進入監測中 ---> 最新數據

　　如果我們把服務停掉。就會變成down的狀態：

[root@node1 ~]# systemctl stop redis

　　發現我們的監控項是可以正常使用的。

3.修改宏

　　如果我們把node1節點上的redis服務監聽端口手動改掉的話，我們剛剛定義的監控項就不能正常使用了，這樣的話，我們就需要去修改宏。
　　但是，這畢竟只是個例，所以我們不需要去修改全局宏，只用修改模板宏或者主機宏就可以了。
　　下面分別說一下，模板宏和主機宏的不同修改操作：
模板宏
　　模板宏的修改，我們需要進入：配置 ---> 模板 ---> redis stats（相應的模板） ---> 宏

　　在這里點擊添加就可以了。
主機宏
　　主機宏的修改，我們需要進入：配置 ---> 主機 ---> 所有主機 ---> node1 ---> 宏

　　在這里點擊添加就可以了。

以上，監控的基本知識已經介紹完畢。預知后事如何，請聽下回分解~

由於部分圖片過大可能不能顯示完全，但是可以在瀏覽器新窗口打開喏~打開了的話就是完整的圖了φ(>ω<*)

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 企業級的分布式開源監控解決方案 zabbix v5.0 LTS Nagios：企業級系統監控方案 JAVA企業級應用Tomcat實戰 java企業級應用TOMCAT實戰項目實戰9—企業級分布式存儲應用與實戰MogileFS、FastDFS Vue3+ElementPlus開發內容創作社區企業級項目實戰【第二版】高仿Android網易雲音樂企業級項目實戰課程介紹【實戰】Vue3.0(正式版)+TypeScript仿知乎專欄企業級項目教程 Flask企業級論壇實戰目錄導航企業級實戰模塊十：服務網格Istio