PHP - pcntl_fork() 執行過程詳解


 


<?php   
$pid = pcntl_fork();
if ($pid == -1)
{
    die("could not fork");
}
elseif($pid == 0)
{
    echo "I'm the child  
process  \n";
}
else
{
    echo "I'm the parent 
process  \n";
    exit;
}


要搞清楚fork的執行過程,就必須先弄清楚操作系統中”進程(process)”概念。

一個進程,主要包含三個元素:

1. 一個可以執行的程序;
2. 和該進程相關聯的全部數據(包括變量,內存空間,緩沖區等等);
3. 程序的執行上下文(execution context);


不妨簡單理解為,一個進程表示的就是一個可執行程序的一次執行過程中的一個狀態。操作系統對進程的管理,典型的情況,是通過進程表完成的。進程表中的每一個表項,記錄的是當前操作系統中一個進程的情況。對於單 CPU的情況而言,每一特定時刻只有一個進程占用 CPU,但是系統中可能同時存在多個活動的(等待執行或繼續執行的)進程。

一個稱為”程序計數器(program counter, pc)”的寄存器,指出當前占用 CPU的進程要執行的下一條指令的位置。

當分給某個進程的 CPU時間已經用完,操作系統將該進程相關的寄存器的值,保存到該進程在進程表中對應的表項里面;把將要接替這個進程占用 CPU的那個進程的上下文,從進程表中讀出,並更新相應的寄存器(這個過程稱為”上下文交換(process context switch)”,實際的上下文交換需要涉及到更多的數據,那和fork無關,不再多說,主要要記住程序寄存器pc指出程序當前已經執行到哪里,是進程上 下文的重要內容,換出 CPU的進程要保存這個寄存器的值,換入CPU的進程,也要根據進程表中保存的本進程執行上下文信息,更新這個寄存器)。

好了,有這些概念打底,可以說fork了,當你的程序執行到下面的語句:
pid = pcntl_fork();
操作系統創建一個新的進程(子進程),並且在進程表中相應為它建立一個新的表項。新進程和原有進程的可執行程序是同一個程序;上下文和數據,絕大部分就是原進程(父進程)的拷貝,但它們是兩個相互獨立的進程!此時程序寄存器pc在父、子進程的上下文中都聲稱,這個進程目前執行到fork調用即將返回(此時子進程不占有CPU,子進程的pc不是真正保存在寄存器中,而是作為進程上下文保存在進程表中的對應表項內)。問題是怎么返回,在父子進程中就分道揚鑣。

父進程繼續執行操作系統對fork的實現,使這個調用在父進程中返回剛剛創建的子進程的pid(一個正整數),所以后面的if語句中pid<0, pid==0的兩個分支都不會執行。所以輸出:i am the parent process…

接着子進程在之后的某個時候得到調度,它的上下文被換入,占據 CPU,操作系統對fork的實現使得子進程中fork調用返回0,所以在這個進程中pid=0(注意這不是父進程了哦,雖然是同一個程序,但是這是同一個程序的另外一次執行,在操作系統中這次執行是由另外一個進程表示的,從執行的角度說和父進程相互獨立)。這個進程在繼續執行的過程中,if語句中 pid<0不滿足,但是pid==0是true,所以輸出:i am the child process…

我想你比較困惑的就是:

為什么看上去程序中互斥的兩個分支都被執行了,在一個程序的一次執行中,這當然是不可能的,事實上你看到的兩行輸出是來自兩個獨立的進程,而這兩個進程來自同一個程序的兩次執行。

-----------------------------------------

fork之后,操作系統會復制一個與父進程完全相同的子進程,雖說是父子關系,但是在操作系統看來,他們更像兄弟關系,這2個進程共享代碼空間,但是數據空間是互相獨立的,子進程數據空間中的內容是父進程的完整拷貝,指令指針也完全相同,但只有一點不同,如果fork成功,子進程中fork的返回值是0,父進程中fork的返回值是子進程的進程號,如果fork失敗,父進程會返回錯誤。
可以這樣想象,2個進程一直同時運行,而且步調一致,在fork之后,他們分別作不同的工作,也就是分岔了,這也是fork為什么叫fork的原因。
至於哪一個進程最先運行,這與操作系統平台的調度算法有關,而且這個問題在實際應用中並不重要,如果需要父子進程協同運作,可以通過控制語法結構的辦法解決。

-----------------------------------------

fork前子進程可以繼承父進程的東西,但是在pcntl_fork()后子進程和父進程就沒有任何繼承關系了。在子進程里創建的東西是子進程的,在父進程創建的東西是父進程的,可以完全看成是兩個獨立的進程。

-----------------------------------------

在程序段里用了pcntl_fork()之后程序出了分岔,派生出了兩個進程,具體哪個先運行就看該系統的調度算法了。
在這里,我們可以這么認為,在運行到”pid=pcntl_fork();”時系統派生出一個跟主程序一模一樣的子進程。該進程的”pid=pcntl_fork();”一句中 pid得到的就是子進程本身的pid;子進程結束后,父進程的”pid=pcntl_fork();”中pid得到的就是父進程本身的pid,因此該程序有兩行輸出。

-----------------------------------------

pcntl_fork()函數復制了當前進程的PCB,並向父進程返回了派生子進程的pid,父子進程並行,打印語句的先后完全看系統的調度算法,打印的內容控制則靠pid變量來控制。因為我們知道pcntl_fork()向父進程返回了派生子進程的pid,是個正整數;而派生子進程的pid變量並沒有被改變,這一區別使得我們看到了他們的不同輸出。

-----------------------------------------

1. 派生子進程的進程,即父進程,其pid不變;
2. 對子進程來說,fork()函數返回給它0, 但它自身的pid絕對不會是0;之所以fork()函數返回0給它,是因為它隨時可以調用getpid()來獲取自己的pid;
3. fork之后父、子進程除非采用了同步手段,否則不能確定誰先運行,也不能確定誰先結束。認為子進程結束后父進程才從fork返回的,這是不對的,fork不是這樣的,vfork才這樣。

-----------------------------------------


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM