日前遇到dubbo注冊到zookeeper服務失敗的情況,失敗后dubbo不會自動重新注冊,會導致服務訪問問題Not found export service....異常
研究后寫了個Python腳本,利用telnetlib 監控dubbo狀態,失敗后重啟tomcat重新注冊。
利用zabbix 監控觸發器,遠程執行cmd腳本,重啟通tomcat服務,dubbo會自動重新注冊
#!/usr/bin/env python # coding:utf-8 #__Author: Evan __ """ 先用telnet命令登錄dubbo 20880端口 如果dubbo端口不存在,即服務關閉,會有異常Exception 必須處理 try: xxx exception: xxx 然后判斷一下dubbo狀態 status 如果OK就正常,否則異常 我用了zabbix自定義監控項,正常返回1, 異常為0 """ import time from telnetlib import Telnet HOST = '192.168.100.31' PORT = 20880 status_cmd = 'status -l' def check_dubbo_status(Host=None, Port=None, status_cmd=''): tn = Telnet() try: tn.open(Host, Port) tn.write(status_cmd + '\n') time.sleep(2) tn.write('exit\n') res = tn.read_very_eager() return res except Exception as e: return 0 if __name__ == '__main__': result = check_dubbo_status(Host=HOST, Port=PORT, status_cmd=status_cmd) if result != 0: res = result.split('\n') restr = res[9].split('|') if restr[2].strip() == 'OK' print 1 print 'dubbo registry status ok' else: print 0 else: print 0
利用zabbix 自定義監控項,服務狀態異常時返回0, 觸發zabbix報警,遠程執行cmd命令,在服務器上重啟tomcat, dubbo重新注冊到zookeeper上
1、將腳本放到alertscript目錄中,在zabbix_agentd.conf 文件中添加自定義項
UserParameter=dubbo.status, /usr/local/zabbix/alertscripts/chk_dubbo.py
2、重啟zabbix客戶端服務
3、在zabbix 上添加新的監控項,設置觸發器報警
4、設置觸發器動作,在動作---操作中配置 在當前主機上執行遠程命令
注意!:zabbix的腳本要賦執行權限,並且腳本的運行用戶必須是zabbix,
但zabbix用戶沒有重啟tomcat服務的權限,所以需要sudo授權,zabbix用戶有sudo權限可以執行tomcat重啟腳本命令