問題描述:當SSH遠程連接到服務器上,然后運行一個服務 ./catalina.sh start,然后把終端開閉(切斷SSH連接)之后,發現該服務中斷,導致網頁無法訪問。
元凶:SIGHUP 信號
讓我們來看看為什么關掉窗口/斷開連接會使得正在運行的程序死掉。
在Linux/Unix中,有這樣幾個概念:
進程組(process group):一個或多個進程的集合,每一個進程組有唯一一個進程組ID,即進程組長進程的ID。
會話期(session):一個或多個進程組的集合,有唯一一個會話期首進程(session leader)。會話期ID為首進程的ID。
會話期可以有一個單獨的控制終端(controlling terminal)。與控制終端連接的會話期首進程叫做控制進程(controlling process)。當前與終端交互的進程稱為前台進程組。其余進程組稱為后台進程組。
根據POSIX.1定義:
掛斷信號(SIGHUP)默認的動作是終止程序。
當終端接口檢測到網絡連接斷開,將掛斷信號發送給控制進程(會話期首進程)。
如果會話期首進程終止,則該信號發送到該會話期前台進程組。
一個進程退出導致一個孤兒進程組中產生時,如果任意一個孤兒進程組進程處於STOP狀態,發送SIGHUP和SIGCONT信號到該進程組中所有進程。(關於孤兒進程參照:http://blog.csdn.net/hmsiwtv/article/details/7901711 )
結論:因此當網絡斷開或終端窗口關閉后,也就是SSH斷開以后,控制進程收到SIGHUP信號退出,會導致該會話期內其他進程退出。
簡而言之:就是ssh 打開以后,bash等都是他的子程序,一旦ssh關閉,系統將所有相關進程殺掉!! 導致一旦ssh關閉,執行中的任務就取消了
我們來看一個例子。打開兩個SSH終端窗口,在其中一個運行top命令。
[root@tivf09 root]# top
在另一個終端窗口,找到top的進程ID為5180,其父進程ID為5128,即登錄shell。
[root@tivf09 root]# ps -ef|grep top
root 5180 5128 0 01:03 pts/0 00:00:02 top
root 5857 3672 0 01:12 pts/2 00:00:00 grep top
使用pstree命令可以更清楚地看到這個關系:
[root@tivf09 root]# pstree -H 5180|grep top
|-sshd-+-sshd---bash---top
使用ps-xj命令可以看到,登錄shell(PID 5128)和top在同一個會話期,shell為會話期首進程,所在進程組PGID為5128,top所在進程組PGID為5180,為前台進程組。
[root@tivf09 root]# ps -xj|grep 5128
5126 5128 5128 5128 pts/0 5180 S 0 0:00 -bash
5128 5180 5180 5128 pts/0 5180 S 0 0:50 top
3672 18095 18094 3672 pts/2 18094 S 0 0:00 grep 5128
關閉第一個SSH窗口,在另一個窗口中可以看到top也被殺掉了。
[root@tivf09 root]# ps -ef|grep 5128
root 18699 3672 0 04:35 pts/2 00:00:00 grep 5128
問題2 為什么守護程序就算ssh 打開的,就算關閉ssh也不會影響其運行?
因為他們的程序特殊,比如httpd –k start運行這個以后,他不屬於sshd這個進程組 而是單獨的進程組,所以就算關閉了ssh,和他也沒有任何關系!
[root@CentOS5-4 ~]# pstree |grep http
|-httpd
[root@CentOS5-4 ~]# pstree |grep top
|-sshd-+-sshd---bash---top
結論:守護進程的啟動命令本身就是特殊的,和一般命令不同的,比如mysqld_safe 這樣的命令 一旦使用了 就是守護進程運行。所以想把一般程序改造為守護程序是不可能,
問題3 使用后台運行命令& 能否將程序擺脫ssh進程組控制呢 也就是ssh關閉,后台程序繼續運行?
我們做一個試驗: find / -name ‘*http*’&
利用ctrl+d 注銷以后 再進入系統 會不會看見這個命令再運行?
答案是 :命令被中止了!!
因為他依然屬於這個ssh進程組 就算加了&也無法擺脫!!
[root@CentOS5-4 ~]# pstree |grep find
|-sshd-+-sshd---bash---find
結論就是:只要是ssh 打開執行的一般命令,不是守護程序,無論加不加&,一旦關閉ssh,系統就會用SIGHUP終止
問題4 nohup能解決的問題
但是為了能夠再注銷以后 依然能后台運行,那么我們就可以使用nohup這個命令,我們現在開始查找find / -name ‘*http*’&
,並且希望在后台運行,
那么就使用nohup:nohup find / -name "*httpd*"
此時默認地程序運行的輸出信息放到當前文件夾的nohup.out 文件中去
加不加&並不會影響這個命令 只是讓程序 前台或者后台運行而已
雖然nohup很容易使用,但還是比較“簡陋”的,對於簡單的命令能夠應付過來,對於復雜的需要人機交互的任務就麻煩了。
其實我們可以使用一個更為強大的實用程序screen。流行的Linux發行版(例如Red Hat Enterprise Linux 4)通常會自帶screen實用程序,如果沒有的話,可以從GNU screen的官方網站下載。
1)使用
執行screen , 按任意鍵進入子界面;
我用ping命令開始執行,如果下班了,但是想關閉ssh以后ping繼續運行,那么按ctrl+a 再按d 這樣暫停了子界面,會顯示[detached]的字樣,這時候 我回到了父界面;
用screen –ls查看目前子界面的狀態screen -ls
There is a screen on: 22292.pts-3.free (Detached)
1 Socket in /tmp/screens/S-root,這里的22292其實是子界面的pid號;
如果回到子界面 用screen –r 22292,一下子彈到了ping 的子界面;
2)更多幫助
可以通過C-a(ctrl+a)?來查看所有的鍵綁定,常用的鍵綁定有:
C-a ?
顯示所有鍵綁定信息
C-a w
顯示所有窗口列表
C-a C-a
切換到之前顯示的窗口
C-a c
創建一個新的運行shell的窗口並切換到該窗口
C-a n
切換到下一個窗口
C-a p
切換到前一個窗口(與C-a n相對)
C-a 0..9
切換到窗口0..9
C-a a
發送C-a到當前窗口
C-a d
暫時斷開screen會話
C-a k
殺掉當前窗口
C-a [
進入拷貝/回滾模式
其他常用選項:
-c file
使用配置文件file,而不使用默認的$HOME/.screenrc
-d|-D [pid.tty.host]
不開啟新的screen會話,而是斷開其他正在運行的screen會話
-h num
指定歷史回滾緩沖區大小為num行
-list|-ls
列出現有screen會話,格式為pid.tty.host
-d -m
啟動一個開始就處於斷開模式的會話
-r sessionowner/ [pid.tty.host]
重新連接一個斷開的會話。多用戶模式下連接到其他用戶screen會話需要指定sessionowner,需要setuid-root權限
-S sessionname
創建screen會話時為會話指定一個名字
-v
顯示screen版本信息
-wipe [match]
同-list,但刪掉那些無法連接的會話
- Linux 技巧:讓進程在后台可靠運行的幾種方法,https://www.ibm.com/developerworks/cn/linux/l-cn-nohup/