Linux中的defunct進程(僵屍進程)


一、什么是defunct進程(僵屍進程)?
在 Linux 系統中,一個進程結束了,但是他的父進程沒有等待(調用wait / waitpid)他,那么他將變成一個僵屍進程。當用ps命令觀察進程的執行狀態時,看到這些進程的狀態欄為defunct。僵屍進程是一個早已死亡的進程,但在進程表(processs table)中仍占了一個位置(slot)。
但是如果該進程的父進程已經先結束了,那么該進程就不會變成僵屍進程。因為每個進程結束的時候,系統都會掃描當前系統中所運行的所有進程,看看有沒有哪個進程是剛剛結束的這個進程的子進程,如果是的話,就由Init進程來接管他,成為他的父進程,從而保證每個進程都會有一個父進程。而Init進程會自動wait其子進程,因此被Init接管的所有進程都不會變成僵屍進程。
二、 Linux下進程的運作方式
如果子進程先於父進程退出, 同時父進程又沒有調用wait/waitpid,則該子進程將成為僵屍進程。如果該進程的父進程已經先結束了,那么該進程就不會變成僵屍進程。因為每個進程結束的時候,系統都會掃描當前系統中所運行的所有進程,看看有沒有哪個 進程是剛剛結束的這個進程的子進程,如果是的話,就由Init進程來接管他,成為他的父進程,從而保證每個進程都會有一個父進程。而Init進程會自動 wait其子進程,因此被Init接管的所有進程都不會變成僵屍進程。
每個 Linux進程在進程表里都有一個進入點(entry),核心進程執行該進程時使用到的一切信息都存儲在進入點。當用 ps 命令察看系統中的進程信息時,看到的就是進程表中的相關數據。當以fork()系統調用建立一個新的進程后,核心進程就會在進程表中給這個新進程分配一個進入點,然后將相關信息存儲在該進入點所對應的進程表內。這些信息中有一項是其父進程的識別碼。
子進程的結束和父進程的運行是一個異步過程,即父進程永遠無法預測子進程到底什么時候結束。那么會不會因為父進程太忙來不及 wait 子進程,或者說不知道子進程什么時候結束,而丟失子進程結束時的狀態信息呢?
不會。因為 Linux提供了一種機制可以保證,只要父進程想知道子進程結束時的狀態信息,就可以得到。這種機制就是:當子進程走完了自己的生命周期后,它會執行exit()系統調用,內核釋放該進程所有的資源,包括打開的文件,占用的內存等。但是仍然為其保留一定的信息(包括進程號the process ID,退出碼exit code,退出狀態the terminationstatus of the process,運行時間the amount of CPU time taken by the process等),這些數據會一直保留到系統將它傳遞給它的父進程為止,直到父進程通過wait / waitpid來取時才釋放。
也就是說,當一個進程死亡時,它並不是完全的消失了。進程終止,它不再運行,但是還有一些殘留的數據等待父進程收回。當父進程 fork() 一個子進程后,它必須用 wait() (或者 waitpid())等待子進程退出。正是這個 wait() 動作來讓子進程的殘留數據消失。
三、僵屍進程的危害
如果父進程不調用wait / waitpid的話,那么保留的那段信息就不會釋放,其進程號就會一直被占用,但是系統的進程表容量是有限的,所能使用的進程號也是有限的,如果大量的產生僵屍進程,將因為沒有可用的進程號而導致系統不能產生新的進程。
所以,defunct進程不僅占用系統的內存資源,影響系統的性能,而且如果其數目太多,還會導致系統癱瘓。而且,由於調度程序無法選中Defunct 進程,所以不能用kill命令刪除Defunct 進程,惟一的方法只有重啟系統。
四、如何殺死defunct進程
defunct進程是指出錯損壞的進程,父子進程之間不會再通信。有時,它們會演變成“僵屍進程”,存留在你的系統中,直到系統重啟。可以嘗試 “kill -9” 命令來清除,但多數時候不管用。
為了殺死這些defunct進程,你有兩個選擇:
1.重啟你的計算機
2.繼續往下讀…
我們先看看系統中是否存在defunct進程:
$ ps -A|grep defunct
1
輸出
5259 ?        00:00:00 sd_cicero <defunct>
12214 pts/18   00:01:14 python <defunct>
16989 pts/18   00:04:43 python <defunct>
20610 pts/18   00:23:12 python <defunct>
1
2
3
4
看看這些進程的ID及其父進程ID:
$ ps -ef | grep defunct | more
1
UID PID PPID ...
==========================================================================
yourname     4653  6128  0 17:07 pts/18   00:00:00 grep --color=auto defunct
yourname     5259  5258  0 15:58 ?        00:00:00 [sd_cicero] <defunct>
yourname    12214 12211  4 16:41 pts/18   00:01:14 [python] <defunct>
yourname    16989 16986 20 16:45 pts/18   00:04:43 [python] <defunct>
yourname    20610 18940 99 16:48 pts/18   00:23:12 [python] <defunct>
1
2
3
4
5
6
7
UID:用戶ID
PID:進程ID
PPID:父進程ID
如果你使用命令 “kill -9 12214” 嘗試殺死ID為12214的進程,可能會沒效果。
我們來試一下
$ kill -9 12214
$ ps -A|grep defunct
1
2
輸出
 5259 ?        00:00:00 sd_cicero <defunct>
12214 pts/18   00:01:14 python <defunct>
16989 pts/18   00:04:43 python <defunct>
20610 pts/18   00:23:12 python <defunct>
1
2
3
4
進程12214 仍然存才,說明用kill殺不掉它。
要想成功殺死該進程,需要對其父進程(ID為12211)執行kill命令($ kill -9 12211)。對所有這些進程的父進程ID應用kill命令,並驗證結果($ ps -A | grep defunct)。
我們來試一下
$ kill -9 12211
$ ps -A|grep defunct
1
2
輸出
5259 ?        00:00:00 sd_cicero <defunct>
16989 pts/18   00:04:43 python <defunct>
20610 pts/18   00:23:12 python <defunct>
[1]   Killed                  bash main.sh
1
2
3
4
進程12214消失,說明可以通過kill僵屍進程的父進程來殺死僵屍進程。
如果前一個命令顯示無結果,那么搞定!否則,可能你需要重啟一下系統。
---------------------
作者:DarrenXf
來源:CSDN
原文:https://blog.csdn.net/DarrenXf/article/details/82970809
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM