本章博客我們一起來聊一聊如何監控mysql數據庫主從狀態?
思路梳理:
1)首先我們都知道,判斷Mysql主從是否正常,是通過主從上面的SQL和IO線程都為yes狀態判斷(通過awk取值,grep過濾和統計yes的個數,如果為2則為正常值),隨后我們取值得腳本或者命令寫入zabbix-agent端的配置文件中的“Userparamenter”,格式 為:Userparamenter [自定義 鍵值] ,[腳本或者命令參數]
2)我們zabbix沒有監控主從的模板和監控項,所以我們需要自己定義添加,創建監控項和圖形都是可以的
3)創建完成之后,我們可以為zabbix主從狀態定義監控報警
下面是主從之前的配置,在這里就不在詳細的闡述了,如果主從不熟悉的童鞋可以參考一下即可
mysql-master端: [root@mysql-master]# vim /etc/my.cnf server-id =1 log-bin=/var/lib/mysql/mysql-bin root@mysql-master # /etc/init.d/mysqld restart mysql> grant replication slave on *.* to 'xiaoyu'@'192.168.17.138' identified by '123.com'; Query OK, 0 rows affected (0.00 sec) mysql> flush privileges; mysql> show master status; +------------------+----------+--------------+------------------+ | File | Position | Binlog_Do_DB | Binlog_Ignore_DB | +------------------+----------+--------------+------------------+ | mysql-bin.000001 | 339 | | | +------------------+----------+--------------+------------------+ 1 row in set (0.00 sec) mysql-slave端 [root@mysql-slave]# vim /etc/my.cnf server-id =2 log-bin=/var/lib/mysql/mysql-bin [root@mysql-slave~]# /etc/init.d/mysqld restart mysql> slave stop; Query OK, 0 rows affected, 1 warning (0.00 sec) mysql> change master to -> master_host='192.168.17.129', -> master_user='xiaoyu', -> master_password='123.com', -> master_log_file='mysql-bin.000001', -> master_log_pos=339; Query OK, 0 rows affected (0.06 sec) mysql> slave start; Query OK, 0 rows affected (0.00 sec) mysql> show slave status\G *************************** 1. row *************************** Slave_IO_State: Waiting for master to send event Master_Host: 192.168.17.129 Master_User: xiaoyu Master_Port: 3306 Connect_Retry: 60 Master_Log_File: mysql-bin.000001 Read_Master_Log_Pos: 339 Relay_Log_File: mysqld-relay-bin.000002 Relay_Log_Pos: 251 Relay_Master_Log_File: mysql-bin.000001 Slave_IO_Running: Yes Slave_SQL_Running: Yes
一:首先在Mysql-slave端創建mysql主從項取值
2)#測試 通過grep過濾出關鍵詞"Running"狀態,awk打印出第二列的"Yes",最后由grep -c統計“Yes”的個數
[root@mysql-slave ~]# mysql -u root -p123456 -e "show slave status\G" | grep "Running" |awk "{print $2}" | grep -c "Yes"
2
2)將這條語句寫入agent.conf配置文件中
[root@mysql-slave ~]# vim /usr/local/zabbix/etc/zabbix_agentd.conf
UserParameter=mysql.replication,mysql -u root -p123456 -e "show slave status\G" | grep "Running" |awk '{print $2}' | grep -c "Yes"
[root@mysql-slave ~]# /etc/init.d/zabbix_agent restart
最后在zabbix-server端抓取mysql-slave端的數據
[root@zabbix-server ~]# /usr/local/zabbix/bin/zabbix_get -s 192.168.17.138 -k mysql.replication #抓取mysql-slave端的鍵值,如果返回數值2.則表明IO和SQL線程狀態都為yes狀態,則表明主從正常
二:【Zabbix-server-web端配置】
2.1:創建一個監控項作為mysql主從
2.2:創建mysql主從監控圖形
三:【創建觸發器,實現主從異常報警】
到目前為止 ,我們的mysql主從到主從郵件報警設置一條龍服務已經完成,接下來測試一下,臨時關閉mysql從的slave stop`
OK(ps:之前已經郵件服務報警此時,報警直接觸發)
【生產環境遇到的坑 】
當我在server端執行zabbix_get測試檢查是否獲取到key值,卻提示無法通過套接字“/opt/mysql/data/mysql.sock”連接到本地MySQL服務
zabbix_get獲取agent自定義的key值和mysql.sock有什么關系呢?難道在agent端不存在sock文件?答應肯定是存在的,並且我測試了一下agent的普通key值system.uname,是正常獲取的,說明在通信這一塊是沒問題的。
另外,我們把焦點看下權限,這個數據庫授權獲取key值都是通過zabbix這個普通用戶的
我們在看下agent段的zabbix用戶是存在的,只不過是被禁止shell登陸,這倒是沒關系
Ps:在這里我們給予zabbix登錄權限,切換到zabbix普通用戶,以普通zabbix用戶在本地執行/usr/bin/mysql -uzabbix -pzabbix -e "show slave status\G" | grep "Running" |awk '{print $2}' | grep -c "Yes",會發現也會報mysql.sock問題,但是以管理員的身份能正常獲取;
此時,我們在zabbix.conf配置文件中做修改,也就是加上sudo 以普通用戶zabbix獲取key值數據
mysql.replication,sudo /usr/bin/mysql -uzabbix -pzabbix -e "show slave status\G" | grep "Running" |awk '{print $2}' | grep -c "Yes"
修改完成之后,再次執行zabbix_get,之前的錯誤沒有了,新問題有出現了,提示sudo: sorry, you must have a tty to run sudo
此時我們只需要在agent端修改/etc/sudoers配置文件即可
1)Defaults requiretty,修改為 #Defaults requiretty,表示不需要控制終端。
2)允許zabbx普通用戶執行mysql命令調用key值
到此為之結束!