一、supervisor簡介
Supervisor是用Python開發的一套通用的進程管理程序,能將一個普通的命令行進程變為后台daemon,並監控進程狀態,異常退出時能自動重啟。它是通過fork/exec的方式把這些被管理的進程當作supervisor的子進程來啟動,這樣只要在supervisor的配置文件中,把要管理的進程的可執行文件的路徑寫進去即可。也實現當子進程掛掉的時候,父進程可以准確獲取子進程掛掉的信息的,可以選擇是否自己啟動和報警。supervisor還提供了一個功能,可以為supervisord或者每個子進程,設置一個非root的user,這個user就可以管理它對應的進程。
supervisor是所有項目的父進程:
supervisor(pid=29208)會成為主進程,管理各個項目的進程。
當項目A(pid=11531)掛掉,supervisor根據設置autorestart、startretries是否重啟。
若要重啟,則會重啟項目A(pid=13357),
若不重啟,則項目A(pid=0)。
當supervisor被kill,管理的項目全部死掉,重啟supervisor(pid=14140),管理的項目都重啟;
supervisor是如何知道某項目掛掉的?
子進程異常退出的時候,作為父進程肯定是能收到信號的。
-
簡單
為啥簡單呢?因為咱們通常管理linux進程的時候,一般來說都需要自己編寫一個能夠實現進程start/stop/restart/reload功能的腳本,然后丟到/etc/init.d/下面。這么做有很多不好的地方,第一我們要編寫這個腳本,這就很耗時耗力了。第二,當這個進程掛掉的時候,linux不會自動重啟它的,想要自動重啟的話,我們還要自己寫一個監控重啟腳本。而,supervisor則可以完美的解決這些問題。好,怎么解決的呢,其實supervisor管理進程,就是通過fork/exec的方式把這些被管理的進程,當作supervisor的子進程來啟動。這樣的話,我們只要在supervisor的配置文件中,把要管理的進程的可執行文件的路徑寫進去就OK了。這樣就省下了我們如同linux管理進程的時候,自己寫控制腳本的麻煩了。第二,被管理進程作為supervisor的子進程,當子進程掛掉的時候,父進程可以准確獲取子進程掛掉的信息的,所以當然也就可以對掛掉的子進程進行自動重啟了,當然重啟還是不重啟,也要看你的配置文件里面有木有設置autostart=true了,這是后話。
-
精確
為啥說精確呢?因為linux對進程狀態的反饋,有時候不太准確。為啥不准確?這個樓主也不知道啊,官方文檔是這么說的,知道的告訴樓主一下吧,感激不盡。而supervisor監控子進程,得到的子進程狀態無疑是准確的。
-
進程組
supervisor可以對進程組統一管理,也就是說咱們可以把需要管理的進程寫到一個組里面,然后我們把這個組作為一個對象進行管理,如啟動,停止,重啟等等操作。而linux系統則是沒有這種功能的,我們想要停止一個進程,只能一個一個的去停止,要么就自己寫個腳本去批量停止。
-
集中式管理
supervisor管理的進程,進程組信息,全部都寫在一個ini格式的文件里就OK了。而且,我們管理supervisor的時候的可以在本地進行管理,也可以遠程管理,而且supervisor提供了一個web界面,我們可以在web界面上監控,管理進程。 當然了,本地,遠程和web管理的時候,需要調用supervisor的xml_rpc接口,這個也是后話。
-
有效性
當supervisor的子進程掛掉的時候,操作系統會直接給supervisor發信號。而其他的一些類似supervisor的工具,則是通過進程的pid文件,來發送信號的,然后定期輪詢來重啟失敗的進程。顯然supervisor更加高效。。。至於是哪些類似supervisor工具,這個樓主就不太清楚了,樓主還聽說過god,director,但是沒用過。有興趣的朋友可以玩玩
-
可擴展性
supervisor是個開源軟件,牛逼點的,可以直接去改軟件。不過咱們大多數人還是老老實實研究supervisot提供的接口吧,supervisor主要提供了兩個可擴展的功能。一個是event機制,這個就是樓主這兩天干的活要用到的東西。再一個是xml_rpc,supervisor的web管理端和遠程調用的時候,就要用到它了。
-
權限
大伙都知道linux的進程,特別是偵聽在1024端口之下的進程,一般用戶大多數情況下,是不能對其進行控制的。想要控制的話,必須要有root權限。而supervisor提供了一個功能,可以為supervisord或者每個子進程,設置一個非root的user,這個user就可以管理它對應的進程了。
不過這功能,用不用就看大伙自己的環境了
二、Supervisor的安裝
-
配置好yum源后,可以直接安裝
yum install supervisor
-
Debian/Ubuntu可通過apt安裝
apt-get install supervisor
-
pip安裝(不推薦)
pip install supervisor
-
easy_install安裝(不推薦)
easy_install supervisor
三、Supervisor的使用
Supervisor 是一個 C/S 模型的程序,supervisord
是 server 端,supervisorctl
是 client 端。
supervisor配置文件:/etc/supervisord.conf
注:supervisor的配置文件默認是不全的,不過在大部分默認的情況下,上面說的基本功能已經滿足。
子進程配置文件路徑:/etc/supervisord.d/
注:默認子進程配置文件為ini格式,可在supervisor主配置文件中修改。
四、Supervisor的配置文件說明
supervisor.conf配置文件說明:
[unix_http_server]
file=/tmp/supervisor.sock ;UNIX socket 文件,supervisorctl 會使用
;chmod=0700 ;socket文件的mode,默認是0700
;chown=nobody:nogroup ;socket文件的owner,格式:uid:gid
;[inet_http_server] ;HTTP服務器,提供web管理界面
;port=127.0.0.1:9001 ;Web管理后台運行的IP和端口,如果開放到公網,需要注意安全性
;username=user ;登錄管理后台的用戶名
;password=123 ;登錄管理后台的密碼
[supervisord]
logfile=/tmp/supervisord.log ;日志文件,默認是 $CWD/supervisord.log
logfile_maxbytes=50MB ;日志文件大小,超出會rotate,默認 50MB,如果設成0,表示不限制大小
logfile_backups=10 ;日志文件保留備份數量默認10,設為0表示不備份
loglevel=info ;日志級別,默認info,其它: debug,warn,trace
pidfile=/tmp/supervisord.pid ;pid 文件
nodaemon=false ;是否在前台啟動,默認是false,即以 daemon 的方式啟動
minfds=1024 ;可以打開的文件描述符的最小值,默認 1024
minprocs=200 ;可以打開的進程數的最小值,默認 200
[supervisorctl]
serverurl=unix:///tmp/supervisor.sock ;通過UNIX socket連接supervisord,路徑與unix_http_server部分的file一致
;serverurl=http://127.0.0.1:9001 ; 通過HTTP的方式連接supervisord
; [program:xx]是被管理的進程配置參數,xx是進程的名稱,在 supervisorctl 中通過這個值來對程序進行一系列的操作
[program:xx]
command=/opt/apache-tomcat-8.0.35/bin/catalina.sh run ; 程序啟動命令
autostart=true ; 在supervisord啟動的時候也自動啟動
startsecs=10 ; 啟動10秒后沒有異常退出,就表示進程正常啟動了,默認為1秒
autorestart=true ; 程序退出后自動重啟,可選值:[unexpected,true,false],默認為unexpected,表示進程意外殺死后才重啟
startretries=3 ; 啟動失敗自動重試次數,默認是3
user=tomcat ; 用哪個用戶啟動進程,默認是root
priority=999 ; 進程啟動優先級,默認999,值小的優先啟動
redirect_stderr=true ; 把stderr重定向到stdout,默認false
stdout_logfile_maxbytes=20MB ; stdout 日志文件大小,默認50MB
stdout_logfile_backups = 20 ; stdout 日志文件備份數,默認是10
; stdout 日志文件,需要注意當指定目錄不存在時無法正常啟動,所以需要手動創建目錄(supervisord 會自動創建日志文件)
stdout_logfile=/opt/apache-tomcat-8.0.35/logs/catalina.out
stopasgroup=false ;默認為false,進程被殺死時,是否向這個進程組發送stop信號,包括子進程
killasgroup=false ;默認為false,向進程組發送kill信號,包括子進程
;包含其它配置文件
[include]
files = /etc/supervisor/conf.d/*.ini ;可以指定一個或多個以.ini結束的配置文件,當然也可以是其他類型的文件
子進程配置文件說明:
給需要管理的子進程(程序)編寫一個配置文件,放在/etc/supervisor.d/
目錄下,以.ini
作為擴展名:
#項目名 [program:blog] #腳本目錄,; 程序的啟動目錄 directory=/opt/bin #腳本執行命令 command=/usr/bin/python /opt/bin/test.py #supervisor啟動的時候是否隨着同時啟動,默認True autostart=true #當程序exit的時候,這個program不會自動重啟,默認unexpected,設置子進程掛掉后自動重啟的情況,有三個選項,false,unexpected和true。如果為false的時候,無論什么情況下,都不會被重新啟動,如果為unexpected,只有當進程的退出碼不在下面的exitcodes里面定義的 autorestart=false #這個選項是子進程啟動多少秒之后,此時狀態如果是running,則我們認為啟動成功了。默認值為1 startsecs=1 #腳本運行的用戶身份 user = test #日志輸出 stderr_logfile=/tmp/blog_stderr.log stdout_logfile=/tmp/blog_stdout.log #把stderr重定向到stdout,默認 false redirect_stderr = true #stdout日志文件大小,默認 50MB stdout_logfile_maxbytes = 20M #stdout日志文件備份數 stdout_logfile_backups = 20
子進程配置示例:
#說明同上
[program:openfire]
environment = JAVA_HOME="/usr/local/xoa/jdk1.8"
command=/usr/local/xoa/openfire/bin/openfire run
startsecs=30
五、supervisorctl命令說明
supervisorctl 是 supervisord 的命令行客戶端工具,使用的配置和 supervisord 一樣,這里就不再說了。下面,主要介紹 supervisorctl 操作的常用命令:
輸入命令 supervisorctl
進入 supervisorctl 的 shell 交互界面,就可以在下面輸入命令了。:
- help # 查看幫助
- status # 查看程序狀態
- stop program_name # 關閉 指定的程序
- start program_name # 啟動 指定的程序
- restart program_name # 重啟 指定的程序
- tail -f program_name # 查看 該程序的日志
- update # 重啟配置文件修改過的程序(修改了配置,通過這個命令加載新的配置)
也可以直接通過 shell 命令操作:
1 supervisorctl status //查看所有進程的狀態 2 supervisorctl stop program_name //停止指定程序 3 supervisorctl start program_name //啟動指定程序 4 supervisorctl restart program_name //重啟指定程序
5 supervisorctl update //配置文件修改后使用該命令加載新的配置
6 supervisorctl reload //重新啟動配置中的所有程序
注:把program_name換成all
可以管理配置中的所有進程。
注意事項
使用supervisor進程管理命令之前先啟動supervisord,否則程序報錯。
使用命令supervisord -c /etc/supervisord.conf
啟動。
若是centos6:
service supervisord start
chkconfig supervisord on
若是centos7:
systemctl start supervisord.service //啟動supervisor並加載默認配置文件 systemctl enable supervisord.service //將supervisor加入開機啟動項
六、常見錯誤
1、supervisor ERROR (spawn error)
參考:https://blog.csdn.net/qq_33468857/article/details/86711841
2、gave up: redis entered FATAL state, too many start retries too quickly
一般是因為進程啟動太慢造成,在superisor的conf中的[program:xxxx]加入啟動時間“startsecs=50”,如果還不行再加大。默認是1秒,重試3次。
一般守護進程的做法就是fork一個子進程,父進程馬上退出,以致於supervisor無法得到子進程的ID。
3、supervisor 沒有保活程序的原因:
1、command中執行的程序是 后台進程、或者是立刻結束的shell腳本,或者是cron表達式,這些command馬上就結束的,supervisor會認為程序已結束,並且重試3次(默認),發現始終起不來,就不再守護進程。supervisorctl命令能看出進程的監控狀態,RUNNING是正常的。
2、看配置文件里面有木有設置autostart=true
注意:
1、supervisor主要適用於監控前台服務。書寫命令時最好以前台命令運行
2、supervisor子進程如需要依賴環境變量才可啟動,寫上environment 參數
更多好文:
https://www.cnblogs.com/549294286/p/9229868.html