Supervisor使用詳解


一、supervisor簡介

Supervisor是用Python開發的一套通用的進程管理程序,能將一個普通的命令行進程變為后台daemon,並監控進程狀態,異常退出時能自動重啟。它是通過fork/exec的方式把這些被管理的進程當作supervisor的子進程來啟動,這樣只要在supervisor的配置文件中,把要管理的進程的可執行文件的路徑寫進去即可。也實現當子進程掛掉的時候,父進程可以准確獲取子進程掛掉的信息的,可以選擇是否自己啟動和報警。supervisor還提供了一個功能,可以為supervisord或者每個子進程,設置一個非root的user,這個user就可以管理它對應的進程。

 

 

supervisor是所有項目的父進程:

 

supervisor(pid=29208)會成為主進程,管理各個項目的進程。

 

當項目A(pid=11531)掛掉,supervisor根據設置autorestart、startretries是否重啟。

 

若要重啟,則會重啟項目A(pid=13357),

 

若不重啟,則項目A(pid=0)。

 

當supervisor被kill,管理的項目全部死掉,重啟supervisor(pid=14140),管理的項目都重啟;

 

 

 

supervisor是如何知道某項目掛掉的?

 

子進程異常退出的時候,作為父進程肯定是能收到信號的。

 

  1. 簡單

    為啥簡單呢?因為咱們通常管理linux進程的時候,一般來說都需要自己編寫一個能夠實現進程start/stop/restart/reload功能的腳本,然后丟到/etc/init.d/下面。這么做有很多不好的地方,第一我們要編寫這個腳本,這就很耗時耗力了。第二,當這個進程掛掉的時候,linux不會自動重啟它的,想要自動重啟的話,我們還要自己寫一個監控重啟腳本。而,supervisor則可以完美的解決這些問題。好,怎么解決的呢,其實supervisor管理進程,就是通過fork/exec的方式把這些被管理的進程,當作supervisor的子進程來啟動。這樣的話,我們只要在supervisor的配置文件中,把要管理的進程的可執行文件的路徑寫進去就OK了。這樣就省下了我們如同linux管理進程的時候,自己寫控制腳本的麻煩了。第二,被管理進程作為supervisor的子進程,當子進程掛掉的時候,父進程可以准確獲取子進程掛掉的信息的,所以當然也就可以對掛掉的子進程進行自動重啟了,當然重啟還是不重啟,也要看你的配置文件里面有木有設置autostart=true了,這是后話。

  2. 精確

    為啥說精確呢?因為linux對進程狀態的反饋,有時候不太准確。為啥不准確?這個樓主也不知道啊,官方文檔是這么說的,知道的告訴樓主一下吧,感激不盡。而supervisor監控子進程,得到的子進程狀態無疑是准確的。

  3. 進程組

    supervisor可以對進程組統一管理,也就是說咱們可以把需要管理的進程寫到一個組里面,然后我們把這個組作為一個對象進行管理,如啟動,停止,重啟等等操作。而linux系統則是沒有這種功能的,我們想要停止一個進程,只能一個一個的去停止,要么就自己寫個腳本去批量停止。

  4. 集中式管理

    supervisor管理的進程,進程組信息,全部都寫在一個ini格式的文件里就OK了。而且,我們管理supervisor的時候的可以在本地進行管理,也可以遠程管理,而且supervisor提供了一個web界面,我們可以在web界面上監控,管理進程。 當然了,本地,遠程和web管理的時候,需要調用supervisor的xml_rpc接口,這個也是后話。

  5. 有效性

    當supervisor的子進程掛掉的時候,操作系統會直接給supervisor發信號。而其他的一些類似supervisor的工具,則是通過進程的pid文件,來發送信號的,然后定期輪詢來重啟失敗的進程。顯然supervisor更加高效。。。至於是哪些類似supervisor工具,這個樓主就不太清楚了,樓主還聽說過god,director,但是沒用過。有興趣的朋友可以玩玩

  6. 可擴展性

    supervisor是個開源軟件,牛逼點的,可以直接去改軟件。不過咱們大多數人還是老老實實研究supervisot提供的接口吧,supervisor主要提供了兩個可擴展的功能。一個是event機制,這個就是樓主這兩天干的活要用到的東西。再一個是xml_rpc,supervisor的web管理端和遠程調用的時候,就要用到它了。

  7. 權限

    大伙都知道linux的進程,特別是偵聽在1024端口之下的進程,一般用戶大多數情況下,是不能對其進行控制的。想要控制的話,必須要有root權限。而supervisor提供了一個功能,可以為supervisord或者每個子進程,設置一個非root的user,這個user就可以管理它對應的進程了。

    不過這功能,用不用就看大伙自己的環境了

 

 

二、Supervisor的安裝

  • 配置好yum源后,可以直接安裝

    yum install supervisor
    
  • Debian/Ubuntu可通過apt安裝

    apt-get install supervisor 
  • pip安裝(不推薦)

    pip install supervisor
    
  • easy_install安裝(不推薦)

    easy_install supervisor

三、Supervisor的使用

Supervisor 是一個 C/S 模型的程序,supervisord 是 server 端,supervisorctl 是 client 端。

supervisor配置文件:/etc/supervisord.conf

注:supervisor的配置文件默認是不全的,不過在大部分默認的情況下,上面說的基本功能已經滿足。

子進程配置文件路徑:/etc/supervisord.d/

注:默認子進程配置文件為ini格式,可在supervisor主配置文件中修改。

 

四、Supervisor的配置文件說明

supervisor.conf配置文件說明:

[unix_http_server]
file=/tmp/supervisor.sock   ;UNIX socket 文件,supervisorctl 會使用
;chmod=0700                 ;socket文件的mode,默認是0700
;chown=nobody:nogroup       ;socket文件的owner,格式:uid:gid
 
;[inet_http_server]         ;HTTP服務器,提供web管理界面
;port=127.0.0.1:9001        ;Web管理后台運行的IP和端口,如果開放到公網,需要注意安全性
;username=user              ;登錄管理后台的用戶名
;password=123               ;登錄管理后台的密碼
 
[supervisord]
logfile=/tmp/supervisord.log ;日志文件,默認是 $CWD/supervisord.log
logfile_maxbytes=50MB        ;日志文件大小,超出會rotate,默認 50MB,如果設成0,表示不限制大小
logfile_backups=10           ;日志文件保留備份數量默認10,設為0表示不備份
loglevel=info                ;日志級別,默認info,其它: debug,warn,trace
pidfile=/tmp/supervisord.pid ;pid 文件
nodaemon=false               ;是否在前台啟動,默認是false,即以 daemon 的方式啟動
minfds=1024                  ;可以打開的文件描述符的最小值,默認 1024
minprocs=200                 ;可以打開的進程數的最小值,默認 200
 
[supervisorctl]
serverurl=unix:///tmp/supervisor.sock ;通過UNIX socket連接supervisord,路徑與unix_http_server部分的file一致
;serverurl=http://127.0.0.1:9001 ; 通過HTTP的方式連接supervisord
 
; [program:xx]是被管理的進程配置參數,xx是進程的名稱,在 supervisorctl 中通過這個值來對程序進行一系列的操作
[program:xx]
command=/opt/apache-tomcat-8.0.35/bin/catalina.sh run  ; 程序啟動命令
autostart=true       ; 在supervisord啟動的時候也自動啟動
startsecs=10         ; 啟動10秒后沒有異常退出,就表示進程正常啟動了,默認為1秒
autorestart=true     ; 程序退出后自動重啟,可選值:[unexpected,true,false],默認為unexpected,表示進程意外殺死后才重啟
startretries=3       ; 啟動失敗自動重試次數,默認是3
user=tomcat          ; 用哪個用戶啟動進程,默認是root
priority=999         ; 進程啟動優先級,默認999,值小的優先啟動
redirect_stderr=true ; 把stderr重定向到stdout,默認false
stdout_logfile_maxbytes=20MB  ; stdout 日志文件大小,默認50MB
stdout_logfile_backups = 20   ; stdout 日志文件備份數,默認是10
; stdout 日志文件,需要注意當指定目錄不存在時無法正常啟動,所以需要手動創建目錄(supervisord 會自動創建日志文件)
stdout_logfile=/opt/apache-tomcat-8.0.35/logs/catalina.out
stopasgroup=false     ;默認為false,進程被殺死時,是否向這個進程組發送stop信號,包括子進程
killasgroup=false     ;默認為false,向進程組發送kill信號,包括子進程
 
;包含其它配置文件
[include]
files = /etc/supervisor/conf.d/*.ini    ;可以指定一個或多個以.ini結束的配置文件,當然也可以是其他類型的文件

子進程配置文件說明:

給需要管理的子進程(程序)編寫一個配置文件,放在/etc/supervisor.d/目錄下,以.ini作為擴展名:

#項目名
[program:blog]
#腳本目錄,; 程序的啟動目錄
directory=/opt/bin
#腳本執行命令
command=/usr/bin/python /opt/bin/test.py

#supervisor啟動的時候是否隨着同時啟動,默認True
autostart=true
#當程序exit的時候,這個program不會自動重啟,默認unexpected,設置子進程掛掉后自動重啟的情況,有三個選項,false,unexpected和true。如果為false的時候,無論什么情況下,都不會被重新啟動,如果為unexpected,只有當進程的退出碼不在下面的exitcodes里面定義的
autorestart=false
#這個選項是子進程啟動多少秒之后,此時狀態如果是running,則我們認為啟動成功了。默認值為1
startsecs=1

#腳本運行的用戶身份 
user = test

#日志輸出 
stderr_logfile=/tmp/blog_stderr.log 
stdout_logfile=/tmp/blog_stdout.log 
#把stderr重定向到stdout,默認 false
redirect_stderr = true
#stdout日志文件大小,默認 50MB
stdout_logfile_maxbytes = 20M
#stdout日志文件備份數
stdout_logfile_backups = 20
子進程配置示例:
#說明同上

[program:openfire]
environment = JAVA_HOME="/usr/local/xoa/jdk1.8"
command=/usr/local/xoa/openfire/bin/openfire run
startsecs=30

 

五、supervisorctl命令說明

supervisorctl 是 supervisord 的命令行客戶端工具,使用的配置和 supervisord 一樣,這里就不再說了。下面,主要介紹 supervisorctl 操作的常用命令:

輸入命令 supervisorctl 進入 supervisorctl 的 shell 交互界面,就可以在下面輸入命令了。:

  • help # 查看幫助
  • status # 查看程序狀態
  • stop program_name # 關閉 指定的程序
  • start program_name # 啟動 指定的程序
  • restart program_name # 重啟 指定的程序
  • tail -f program_name # 查看 該程序的日志
  • update # 重啟配置文件修改過的程序(修改了配置,通過這個命令加載新的配置)

也可以直接通過 shell 命令操作:

1 supervisorctl status        //查看所有進程的狀態
2 supervisorctl stop program_name       //停止指定程序
3 supervisorctl start program_name      //啟動指定程序
4 supervisorctl restart program_name    //重啟指定程序
5 supervisorctl update //配置文件修改后使用該命令加載新的配置
6 supervisorctl reload //重新啟動配置中的所有程序

注:把
program_name換成all可以管理配置中的所有進程。

 

 

注意事項

使用supervisor進程管理命令之前先啟動supervisord,否則程序報錯。
使用命令supervisord -c /etc/supervisord.conf啟動。
若是centos6:

service supervisord start
chkconfig supervisord on

若是centos7:

systemctl start supervisord.service     //啟動supervisor並加載默認配置文件
systemctl enable supervisord.service    //將supervisor加入開機啟動項

 

 六、常見錯誤

1、supervisor ERROR (spawn error)

 參考:https://blog.csdn.net/qq_33468857/article/details/86711841  

2、gave up: redis entered FATAL state, too many start retries too quickly

一般是因為進程啟動太慢造成,在superisor的conf中的[program:xxxx]加入啟動時間“startsecs=50”,如果還不行再加大。默認是1秒,重試3次。 

一般守護進程的做法就是fork一個子進程,父進程馬上退出,以致於supervisor無法得到子進程的ID。

3、supervisor 沒有保活程序的原因:

1、command中執行的程序是 后台進程、或者是立刻結束的shell腳本,或者是cron表達式,這些command馬上就結束的,supervisor會認為程序已結束,並且重試3次(默認),發現始終起不來,就不再守護進程。supervisorctl命令能看出進程的監控狀態,RUNNING是正常的。

2、看配置文件里面有木有設置autostart=true

 

 

注意:

1、supervisor主要適用於監控前台服務。書寫命令時最好以前台命令運行

2、supervisor子進程如需要依賴環境變量才可啟動,寫上environment 參數

 

 

更多好文:

https://www.cnblogs.com/549294286/p/9229868.html

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM