Linux 技巧:讓進程在后台運行的可靠方法


原文鏈接:http://www.ibm.com/developerworks/cn/linux/l-cn-nohup/

想讓進程在斷開連接后依然保持運行?如果該進程已經開始運行了該如何補救? 如果有大量這類需求如何簡化操作?

我們經常會碰到這樣的問題,用 telnet/ssh 登錄了遠程的 Linux 服務器,運行
了一些耗時較長的任務, 結果卻由於網絡的不穩定導致任務中途失敗。如何
讓命令提交后不受本地關閉終端窗口/網絡斷開連接的干擾呢?下面舉了一些
例子, 您可以針對不同的場景選擇不同的方式來處理這個問題。

hangup 名稱的來由
在 Unix 的早期版本中,每個終端都會通過
modem 和系統通訊。當用戶 logout 時,
modem 就會掛斷(hang up)電話。 同
理,當 modem 斷開連接時,就會給終端
發送 hangup 信號來通知其關閉所有子進
程。

 

nohup/setsid/&

 

場景:
如果只是臨時有一個命令需要長時間運行,什么方法能最簡便的保證它在后台穩定運行呢?
解決方法:
我們知道,當用戶注銷(logout)或者網絡斷開時,終端會收到
HUP(hangup)信號從而關閉其所有子進程。因此,我們的解決辦
法就有兩種途徑:要么讓進程忽略 HUP 信號,要么讓進程運行在新
的會話里從而成為不屬於此終端的子進程

 

1. nohup
nohup 無疑是我們首先想到的辦法。顧名思義,nohup 的用途就是讓提交的命令忽略 hangup 信號。讓我
們先來看一下 nohup 的幫助信息:

NOHUP(1) User Commands NOHUP(1)
NAME
nohup - run a command immune to hangups, with output to a non-tty
SYNOPSIS
nohup COMMAND [ARG]...
nohup OPTION
DESCRIPTION
Run COMMAND, ignoring hangup signals.
--help display this help and exit
--version
output version information and exit

可見,nohup 的使用是十分方便的,只需在要處理的命令前加上 nohup 即可,標准輸出和標准錯誤缺省會
被重定向到 nohup.out 文件中。一般我們可在結尾加上"&"來將命令同時放入后台運行,也可
用">filename 2>&1"來更改缺省的重定向文件名。

nohup 示例

[root@pvcent107 ~]# nohup ping www.ibm.com &
[1] 3059
nohup: appending output to `nohup.out'
[root@pvcent107 ~]# ps -ef |grep 3059
root 3059 984 0 21:06 pts/3 00:00:00 ping www.ibm.com
root 3067 984 0 21:06 pts/3 00:00:00 grep 3059
[root@pvcent107 ~]#

 

2. setsid

nohup 無疑能通過忽略 HUP 信號來使我們的進程避免中途被中斷,但如果我們換個角度思考,如果我們

的進程不屬於接受 HUP 信號的終端的子進程,那么自然也就不會受到 HUP 信號的影響了。setsid 就能幫
助我們做到這一點。讓我們先來看一下 setsid 的幫助信息:

SETSID(8) Linux Programmer’s Manual SETSID(8)
NAME
setsid - run a program in a new session
SYNOPSIS
setsid program [ arg ... ]
DESCRIPTION
setsid runs a program in a new session.

可見 setsid 的使用也是非常方便的,也只需在要處理的命令前加上 setsid 即可。

setsid 示例

[root@pvcent107 ~]# setsid ping www.ibm.com
[root@pvcent107 ~]# ps -ef |grep www.ibm.com
root 31094 1 0 07:28 ? 00:00:00 ping www.ibm.com
root 31102 29217 0 07:29 pts/4 00:00:00 grep www.ibm.com
[root@pvcent107 ~]#

值得注意的是,上例中我們的進程 ID(PID)為31094,而它的父 ID(PPID)為1(即為 init 進程 ID),並不
是當前終端的進程 ID。請將此例與nohup 例中的父 ID 做比較。

3. &

這里還有一個關於 subshell 的小技巧。我們知道,將一個或多個命名包含在“()”中就能讓這些命令在子
shell 中運行中,從而擴展出很多有趣的功能,我們現在要討論的就是其中之一。
當我們將"&"也放入“()”內之后,我們就會發現所提交的作業並不在作業列表中,也就是說,是無法通過
jobs來查看的。讓我們來看看為什么這樣就能躲過 HUP 信號的影響吧。

subshell 示例

[root@pvcent107 ~]# (ping www.ibm.com &)
[root@pvcent107 ~]# ps -ef |grep www.ibm.com
root 16270 1 0 14:13 pts/4 00:00:00 ping www.ibm.com
root 16278 15362 0 14:13 pts/4 00:00:00 grep www.ibm.com
[root@pvcent107 ~]#

從上例中可以看出,新提交的進程的父 ID(PPID)為1(init 進程的 PID),並不是當前終端的進程 ID。
因此並不屬於當前終端的子進程,從而也就不會受到當前終端的 HUP 信號的影響了。

 

disown

場景:
我們已經知道,如果事先在命令前加上 nohup 或者 setsid 就可以避免 HUP 信號的影響。但是如果我們未
加任何處理就已經提交了命令,該如何補救才能讓它避免 HUP 信號的影響呢?

解決方法:
這時想加 nohup 或者 setsid 已經為時已晚,只能通過作業調度和 disown 來解決這個問題了。讓我們來看
一下 disown 的幫助信息

disown [-ar] [-h] [jobspec ...]
Without options, each jobspec is removed from the table of
active jobs. If the -h option is given, each jobspec is not
removed from the table, but is marked so that SIGHUP is not
sent to the job if the shell receives a SIGHUP. If no jobspec
is present, and neither the -a nor the -r option is supplied,
the current job is used. If no jobspec is supplied, the -a
option means to remove or mark all jobs; the -r option without
a jobspec argument restricts operation to running jobs. The
return value is 0 unless a jobspec does not specify a valid
job.

可以看出,我們可以用如下方式來達成我們的目的。
用disown -h jobspec來使某個作業忽略HUP信號。
用disown -ah 來使所有的作業都忽略HUP信號。
用disown -rh 來使正在運行的作業忽略HUP信號。

靈活運用 CTRL­z
在我們的日常工作中,我們可以用 CTRLz 來將當前進程掛起到后台暫停運行,執
行一些別的操作,然后再用 fg 來將掛起的進程重新放回前台(也可用 bg 來將掛起
的進程放在后台)繼續運行。這樣我們就
可以在一個終端內靈活切換運行多個任
務,這一點在調試代碼時尤為有用。因為
將代碼編輯器掛起到后台再重新放回時,
光標定位仍然停留在上次掛起時的位置,
避免了重新定位的麻煩

需要注意的是,當使用過 disown 之后,會將把目標作業從作業列表
中移除,我們將不能再使用jobs來查看它,但是依然能夠用ps -ef
查找到它。
但是還有一個問題,這種方法的操作對象是作業,如果我們在運行命
令時在結尾加了"&"來使它成為一個作業並在后台運行,那么就萬事
大吉了,我們可以通過jobs命令來得到所有作業的列表。但是如果
並沒有把當前命令作為作業來運行,如何才能得到它的作業號呢?答案就是用 CTRL­z(按住Ctrl鍵的同時
按住z鍵)了!

CTRL­z 的用途就是將當前進程掛起(Suspend),然后我們就可以用jobs命令來查詢它的作業號,再
用bg jobspec來將它放入后台並繼續運行。需要注意的是,如果掛起會影響當前進程的運行結果,請慎
用此方法。

disown 示例1(如果提交命令時已經用“&”將命令放入后台運行,則可以直接使用“disown”)

[root@pvcent107 build]# cp -r testLargeFile largeFile &
[1] 4825
[root@pvcent107 build]# jobs
[1]+ Running cp -i -r testLargeFile largeFile &
[root@pvcent107 build]# disown -h %1
[root@pvcent107 build]# ps -ef |grep largeFile
root 4825 968 1 09:46 pts/4 00:00:00 cp -i -r testLargeFile largeFile
root 4853 968 0 09:46 pts/4 00:00:00 grep largeFile
[root@pvcent107 build]# logout

-----------------------------------------------------------------------

disown 示例2(如果提交命令時未使用“&”將命令放入后台運行,可使用 CTRL­z 和“bg”將其放入后台,
再使用“disown”)

 

[root@pvcent107 build]# cp -r testLargeFile largeFile2
[1]+ Stopped cp -i -r testLargeFile largeFile2
[root@pvcent107 build]# bg %1
[1]+ cp -i -r testLargeFile largeFile2 &
[root@pvcent107 build]# jobs
[1]+ Running cp -i -r testLargeFile largeFile2 &
[root@pvcent107 build]# disown -h %1
[root@pvcent107 build]# ps -ef |grep largeFile2
root 5790 5577 1 10:04 pts/3 00:00:00 cp -i -r testLargeFile largeFile2
root 5824 5577 0 10:05 pts/3 00:00:00 grep largeFile2
[root@pvcent107 build]#

screen
場景:
我們已經知道了如何讓進程免受 HUP 信號的影響,但是如果有大量這種命令需要在穩定的后台里運行,如
何避免對每條命令都做這樣的操作呢?
解決方法:
此時最方便的方法就是 screen 了。簡單的說,screen 提供了 ANSI/VT100 的終端模擬器,使它能夠在一
個真實終端下運行多個全屏的偽終端。screen 的參數很多,具有很強大的功能,我們在此僅介紹其常用功
能以及簡要分析一下為什么使用 screen 能夠避免 HUP 信號的影響。我們先看一下 screen 的幫助信息:

 

SCREEN(1) SCREEN(1)
NAME
screen - screen manager with VT100/ANSI terminal emulation
SYNOPSIS
screen [ -options ] [ cmd [ args ] ]
screen -r [[pid.]tty[.host]]
screen -r sessionowner/[[pid.]tty[.host]]
DESCRIPTION
Screen is a full-screen window manager that multiplexes a physical
terminal between several processes (typically interactive shells).
Each virtual terminal provides the functions of a DEC VT100 terminal
and, in addition, several control functions from the ISO 6429 (ECMA
48, ANSI X3.64) and ISO 2022 standards (e.g. insert/delete line and
support for multiple character sets). There is a scrollback history
buffer for each virtual terminal and a copy-and-paste mechanism that
allows moving text regions between windows.

使用 screen 很方便,有以下幾個常用選項:
用screen -dmS session name來建立一個處於斷開模式下的會話(並指定其會話名)。

用screen -list 來列出所有會話。
用screen -r session name來重新連接指定會話。
用快捷鍵CTRL-a d 來暫時斷開當前會話。

screen 示例

[root@pvcent107 ~]# screen -dmS Urumchi
[root@pvcent107 ~]# screen -list
There is a screen on:
12842.Urumchi (Detached)
1 Socket in /tmp/screens/S-root.
[root@pvcent107 ~]# screen -r Urumchi

當我們用“­r”連接到 screen 會話后,我們就可以在這個偽終端里面為所欲為,再也不用擔心 HUP 信號會對
我們的進程造成影響,也不用給每個命令前都加上“nohup”或者“setsid”了。這是為什么呢?讓我來看一下
下面兩個例子吧。

1. 未使用 screen 時新進程的進程樹

[root@pvcent107 ~]# ping www.google.com &
[1] 9499
[root@pvcent107 ~]# pstree -H 9499
init─┬─Xvnc
├─acpid
├─atd
├─2*[sendmail]
├─sshd─┬─sshd───bash───pstree
│ └─sshd───bash───ping

我們可以看出,未使用 screen 時我們所處的 bash 是 sshd 的子進程,當 ssh 斷開連接時,HUP 信號自然
會影響到它下面的所有子進程(包括我們新建立的 ping 進程)。

2. 使用了 screen 后新進程的進程樹

[root@pvcent107 ~]# screen -r Urumchi
[root@pvcent107 ~]# ping www.ibm.com &
[1] 9488
[root@pvcent107 ~]# pstree -H 9488
init─┬─Xvnc
├─acpid
├─atd
├─screen───bash───ping
├─2*[sendmail]

而使用了 screen 后就不同了,此時 bash 是 screen 的子進程,而 screen 是 init(PID為1)的子進程。那
么當 ssh 斷開連接時,HUP 信號自然不會影響到 screen 下面的子進程了。

總結
現在幾種方法已經介紹完畢,我們可以根據不同的場景來選擇不同的方案。nohup/setsid 無疑是臨時需要
時最方便的方法,disown 能幫助我們來事后補救當前已經在運行了的作業,而 screen 則是在大批量操作
時不二的選擇了

===========================================================


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM