1、 進程相關概念
當一個進程的時間片用完后,系統把相關的寄存器的值保存到該進程表相應的表項里。同時把代替該進程即將執行的進程的上下文從進程表中讀出,並更新相應的寄存器值,這個過程稱為上下文交換。上下文交換其實就是讀出新的進程的PC(程序計數器),指示當前進程的下一條將要執行的指令。一個進程主要包含以下三個元素:(1)一個正在執行的程序;(2)與該進程相關聯的全部數據(變量,內存,緩沖區);(3)程序上下文(程序計數器pc)
2、頭文件:
#include <unistd.h>
#include <types.h>
3、函數原型:
pid_t fork(void);
pid_t是一個宏,其實質是int類型,被定義在#include <sys/types.h>中;
返回值:1)成功:調用一次則返回兩個值:子進程返回0,父進程返回子進程的PID;
2)失敗:返回-1;
4、獲取進程id:
getpid()、getppid();
5、Fork過程
當前進程(調用者,父進程)調用fork()創建一個新的進程(子進程)。子進程是父進程的副本,它將獲得父進程數據空間、堆、棧(上下文)等資源的副本(注意:(1)子進程copy父進程的變量,內存與緩沖區,即整個的數據空間的內容,但數據空間是獨立的,即父子進程並不共享這些存儲空間。(2)父子進程對打開文件的共享: fork之后,子進程會繼承父進程所打開的文件表,即父子進程共享文件表,該文件表是由內核維護的,兩個進程共享文件狀態,偏移量等。這一點很重要,當在父進程中關閉文件時,子進程的文件描述符仍然有用,相應的文件表也不會被釋放。(3)為了提高效率,fork后並不立即復制父進程空間,采用了COW(Copy-On-Write);當父子進程任意之一,要修改數據段、堆、棧時,進行復制操作,但僅復制修改區域;)。父子進程間共享的存儲空間只有代碼段(只讀的,且僅共享fork()后面的代碼段)。子進程和父進程繼續執行fork調用之后的指令。(4)fork之后,這兩個進程執行沒有固定的先后順序,哪個進程先執行要看系統的進程調度策略。
6、看一個程序:
#include<unistd.h>
#include<stdio.h>
int glob = 6;
char buf[] = "a write to stdout\n";
int main(void)
{
int var = 88;
pid_t pid;
if (write(STDOUT_FILENO, buf, sizeof(buf)-1) != sizeof(buf)-1)
{
printf("write error”);
return 0;
}
printf("before fork\n"); //注意這一行
if ( (pid = fork()) < 0)
{
printf("fork error");
return 0;
}
else if (pid == 0)
{
glob++;
var++;
}
else
{
sleep(2);
}
printf("pid = %d, glob = %d, var = %d\n", getpid(), glob, var);
return 0;
}//fork_test.c
選擇輸出的方式不同,會有不同的輸出結果。
直接輸出到控制台:
a write to stdout
before fork
pid = 1867, glob = 7, var = 89
pid = 1866, glob = 6, var = 88
使用重定向:./fork_test >fork_test.txt,fork_test.txt內容如下:
a write to stdout
before fork
pid = 1939, glob = 7, var = 89
before fork
pid = 1938, glob = 6, var = 88
為什么會有這么大的不同?我們先來看看stdout與STDOUT_FILENO的區別(OS和C++的區別)。
stdin類型為 FILE*;STDIN_FILENO類型為 int。使用stdin的函數主要有:fread、fwrite、fclose等,基本上都以f開頭;使用STDIN_FILENO的函數有:read、write、close等。操作系統一級提供的文件API都是以文件描述符來表示文件,STDIN_FILENO就是標准輸入設備(一般是鍵盤)的文件描述符。標准C++一級提供的文件操作函數庫都是用FILE*來表示文件,stdin就是指向標准輸入設備文件的FILE*。
通過man stdin可以查看到:stdin, stdout, stderr - standard I/O streams(具體自行man)。
stdin / stdout / stderr 分別是指向stream的FILE型的指針變量。當程序啟動時,與其結合的整型文件描述符(fd)分別是0,1,2。STDIN_FILENO / STDOUT_FILENO / STDERR_FILENO 是在<unistd.h>文件中定義的預編譯macro。其值是0,1,2。(通過freopen(3),可以改變與這3個文件描述符(fd)結合的stream值)。也就是說,程序啟動時:FILE * stdin / stdout / stderr 對應的 文件描述符(fd)分別是 STDIN_FILENO(0) / STDOUT_FILENO(1) / STDERR_FILENO(2) 。但是,可以通過FILE *freopen(const char *path, const char *mode, FILE *stream); 來改變,使文件描述符(fd)對應到其他的stream上。(結合到哪個文件stream上,那個文件stream就是變成 標准輸入輸出)。(標准輸入stdin/標准輸出stdout/error輸出stderr要分別改變。)
總結一句話:STDOUT_FILENO是OS提供的,定義在頭文件<unistd.h>中,沒有buffer(直接的系統調用);FILE *stdout是標准C++提供的,定義在頭文件<stdio.h>中,有buffer。
使用stdin / stdout / stderr的函數主要有:fread、fwrite、fclose等,基本上都以f開頭。
使用STDIN_FILENO / STDOUT_FILENO / STDERR_FILENO的函數有:read、write、close等。
上程序:
#include<stdio.h>
#include<unistd.h>
#include<string.h>
#include<errno.h>
#define CHANGE_BY_FREOPEN /* 需要注釋掉,進行切換 */
int main(int argc,char**argv)
{
char buf[]="hello,world\n";
#ifdef CHANGE_BY_FREOPEN
freopen("stdout_text.txt","w",stdout);
//freopen("stderr_text.txt","w",stderr);/* stderr */
#endif
printf("%s",buf);
fwrite(buf,strlen(buf), 1,stdout);
write(STDOUT_FILENO,&buf,strlen(buf));
perror("error out");/* stderr */
return 0;
}/* stdouttest.c */
編譯命令: gcc -o stdouttest stdouttest.c
①當 #define CHANGE_BY_FREOPEN 被注釋掉的時候:終端輸出的結果是:
hello,world
hello,world
hello,world
error out: Sucess
②當 #define CHANGE_BY_FREOPEN 有效的時候:終端輸出的結果是:
error out: Sucess
同時,會創建一個名為stdout_text.txt的文件,該文件中的內容是:
hello,world
hello,world
hello,world
//freopen("stderr_text.txt","w",stderr);/* stderr */如果有效的話():①shell中,什么也不輸出。②stdout_text.txt 中,輸出3個(hello,world + 換行符)。③stderr_text.txt 中,輸出1個(error out: Success)。
接着stdout與STDOUT_FILENO的區別后,下面看下關於"printf"/"write"和緩沖的說明:
printf是在stdio.h中聲明的函數,而標准IO都是帶緩沖的,所以printf是帶緩沖的。而write則是不帶緩沖的。
標准IO在輸入或輸出到終端設備時,它們是行緩沖的,否則(文件)它們是全緩沖的。而標准錯誤流stderr是不使用緩沖的。更為准確的描述是:當且僅當標准輸入和標准輸出並不涉及交互式設備使,他們才是全緩沖的。標准出錯流不使用緩沖。下列情況會引發緩沖區的刷新(清空緩沖區):
1、緩沖區滿時;
2、執行flush語句;
3、執行endl語句(printf是"\n");
4、關閉文件。
綜上所述:write的內容在父進程直接輸出到了設備,“before fork”在主線程輸出到終端后因為換行符而清空了緩沖區,所以也只輸出了一次。而重定向到"a.txt"時,printf使用的是全緩沖,所以“before fork”並未輸出到設備,而是隨着fork()而被復制了一份到子進程的空間中,所以輸出了兩次。
注意:在重定向父進程輸出時,子進程也被重定向了。
另外:為什么父進程要等待2秒?在fork時,父進程所有打開的文件描述符都被復制一份到子進程中,然而他們共享文件描述符所指向的文件對象(FILE結構:描述文件讀寫指針,偏移量,標志等)。如果不等待,文件偏移量被交替修改,很可能產生混亂的輸出。(實際上,這么小的程序,進程執行是很快的,經過實際測試,這部分可以不用,不會產生混亂輸出。)
再看一個例子:
#include <stdio.h>
#include <sys/types.h>
#include <sys/stat.h>
#include <string.h>
#include <sys/wait.h>
#include <unistd.h>
#include <fcntl.h>
#include <stdlib.h>
int main()
{
pid_t childpid;
char buf[100]={0};
int status;//供wait使用的參數
int f;//定義文件標識符
f=open("text",O_CREAT|O_RDWR,0664);
if(f==-1)//文件標識符
{
perror("create file failed!");
return 1;
}
strcpy(buf,"father process’s data\n");
printf("%d\n",15);
//此時創建子進程
childpid=fork();
printf("childpid=%d",childpid);
if(childpid==0)
{ strcpy(buf,"child process’s data\n");
printf("%s",buf);
puts("child process is working");
printf("child process’s PID is: %d\n",getpid());
printf("father process’s PID is: %d\n",getppid());
int n1= write(f,buf,strlen(buf));//把buf的數據輸出重定向到文件中去
close(f);
exit(0);//子進程調用exit函數進入僵死狀態,參數0表示正常退出
}
else {wait(&status);//wait函數是一個等待子進程退出的函數,其參數是一個int類型的指針,保存子進程退出的一些信息
printf("%s/",buf);
puts("father process is working");
printf("father process’s PID is: %d\n",getpid());
printf("child process’s PID is: %d\n",childpid);
int n=write(f,buf,strlen(buf));
close(f);
}
return 0;
}
程序運行結果如下:
15//父進程打印出來的
Child process’s data
Child process is working
Child process’s PID is:4850
Father process’s PID is: 4849
Father process’s data
Father process is working
Father process’s PID is:4849
Child process’s PID is:4850
如果把 printf("%d/n",15); 改為printf("%d",15); ,那么運行的結果為:
15Child process’s data//15是子進程打印出來的
Child process is working
Child process’s PID is:4850
Father process’s PID is: 4849
15Father process’s data//15是父進程打印出來的
Father process is working
Father process’s PID is:4849
Child process’s PID is:4850
分析如下:
1.wait()函數阻塞父進程,直到子進程返回。因此,子進程先執行,直到退出為止。(當然,這里也可以用sleep(10)來完成同樣的功能)
函數說明:wait()會暫時停止目前進程的執行, 直到有信號來到或子進程結束. 如果在調用wait()時子進程已經結束, 則wait()會立即返回子進程結束狀態值. 子進程的結束狀態值會由參數status 返回, 而子進程的進程識別碼也會一快返回. 如果不在意結束狀態值, 則參數 status 可以設成NULL. 子進程的結束狀態值請參考waitpid().
2.為什么printf("%d/n",15); 與 printf("%d",15);打印的結果不相同?
printf("%d/n",15); 與 printf("%d",15); 區別:前者將數據已經輸出到終端上了,后者的數據還在緩沖區內。當創建子進程時,子進程要copy父進程的數據,包括copy緩沖區,所以,第一個程序只打印出一個15,而第二個程序打印出兩個15.還要注意一點,第一個結果的15是由父進程打印出來的,而第二個結果由於子進程先執行,復制緩沖區,所以子進程先打印出15,而后父進程才打印出15.
3. close(f),當子進程已經關閉了文件,父進程怎么還能將數據寫入?
在前面的分析中得知,父子進程共享同一個文件表,共享文件表的狀態,偏移位置等信息。所以在子進程關閉文件描述符后,在父進程中仍然是有效的,而父進程寫數據也從文件的當前位置開始寫。
而linux系統文件流,緩沖及文件描述符與進程之間的關系,可參考http://topic.csdn.net/u/20090309/18/3aba9e11-c8a8-492b-9fe7-29043974a102.html
再來幾個fork的小題目:
#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
int main()
{
pid_t pid1;
pid_t pid2;
pid1 = fork();
pid2 = fork();
printf("pid1=%d,pid2=%d\n",pid1,pid2);
exit(0);
}
要求如下:已知從這個程序執行到這個程序的所有進程結束這個時間段內,沒有其它進程執行。
1、請說出執行這個程序后,一共運行了幾個進程。
2、如果其中一個進程的輸出結果是“pid1=1001, pid2=1002”,寫出其他進程的輸出結果(不考慮進程執行順序)。
答案:
1、一共執行了四個進程。(P0, P1, P2, P3)
2、另外幾個進程的輸出分別為:
pid1:1001, pid2:0
pid1:0, pid2:1003
pid1:0, pid2:0
#include <unistd.h>
#include <stdio.h>
int main ()
{
pid_t fpid; //fpid表示fork函數返回的值
int count=0;
fpid=fork();
if (fpid < 0)
printf("error in fork!");
else if (fpid == 0) {
printf("i am the child process, my process id is %d\n",getpid());
printf("我是爹的兒子\n");//對某些人來說中文看着更直白。
count++;
}
else {
printf("i am the parent process, my process id is %d\n",getpid());
printf("我是孩子他爹\n");
count++;
}
printf("統計結果是: %d\n",count);
return 0;
}
運行結果是:
i am the child process, my process id is 5574
我是爹的兒子
統計結果是: 1
i am the parent process, my process id is 5573
我是孩子他爹
統計結果是: 1
#include <unistd.h>
#include <stdio.h>
int main(void)
{
int i=0;
for(i=0;i<2;i++){
pid_t fpid=fork();
if(fpid==0)
printf("%d child %4d %4d %4d/n",i,getppid(),getpid(),fpid);
else
printf("%d father%4d %4d %4d/n",i,getppid(),getpid(),fpid);
}
return 0;
}
程序運行結果:
0 father 1958 4982 4983 第一行 (P0當i=0時執行fork()后進入else產生的)
1 father 1958 4982 4984 第二行 (P0當i=1時執行fork()后進入else產生的)
0 child 4982 4983 0 第三行 (P0當i=0時執行fork()后進入if產生的)
1 child 4982 4984 0 第四行 (P0當i=1時執行fork()后進入if產生的)
1 father 4982 4983 4985 第五行 (P1當i=1時執行fork()后進入else產生的)
1 child 1 4985 0 第六行 (P1當i=1時執行fork()后進入if產生的)
分析如下:
假設主程序原來的進程為P0。
當i=0時,程序進入循環,P0調用fork(),隨后產生出P1,在P0中fork()返回的fpid是子進程的PID,所以fpid不為0,此時判斷語句進入else,所以會有第一行;在P1中fork()返回的fpid是0,此時判斷語句進入if,所以會有第三行。
當i=1時,(以下P0與P1沒有先后順序,主要看OS的策略)P0再次調用fork(),隨后產生出P2,在P0中fork()返回fpid!=0,進入else,所以會有第二行;在P2中fork()返回fpid=0,進入if,所以會有第四行。另外,i=0時產生的P1也會調用fork(),隨后產生出P3,在P1中fork()返回fpid!=0,進入else,所以會有第五行;在P2中fork()返回fpid=0,進入if,所以會有第六行。
上面值得注意的是第六行中的getppid()值為1。按照上面的分析,按說4985的父進程應該4983嗎?怎么會是1呢?這里得講到進程的創建和死亡的過程,進程4983執行完第二個循環后,main函數就該退出了,也即進程該死亡了,因為它已經做完所有事情了。4983死亡后,4985就沒有父進程了,這在操作系統是不被允許的,所以4985的父進程就被置為init了,init是永遠不會死亡的。看下面的linux父子進程終止的先后順序不同產生不同的結果:
1)父進程先於子進程終止:
此種情況就是孤兒進程。當父進程先退出時,系統會讓init進程接管子進程 。
2)子進程先於父進程終止,而父進程又沒有調用wait或waitpid函數
此種情況子進程進入僵死狀態,且會一直保持下去直到系統重啟。子進程處於僵死狀態時,內核只保存進程的一些必要信息以備父進程所需。此時子進程始終占有着資源,同時也減少了系統可以創建的最大進程數。
僵死狀態:一個已經終止、但是其父進程尚未對其進行善后處理(獲取終止子進程的有關信息,釋放它仍占有的資源)的進程被稱為僵死進程(zombie)。ps命令將僵死進程的狀態打印為Z 。
3)子進程先於父進程終止,而父進程調用了wait或waitpid函數
此時父進程會等待子進程結束。
那么有人可能會問:4983執行完后結束了,從而導致4985沒有了父進程;同樣,4982在第二次循環執行完后也結束了,不是也應該導致4984沒有了父進程了嗎?為什么第四行中的getppid()不是1?這其實在上面提到過,就是因為操作系統調度的問題。理論上來說,第四行和第六行的getppid()“都有可能為1”。
#include <unistd.h>
#include <stdio.h>
int main(void)
{
int i=0;
for(i=0;i<N;i++){
pid_t fpid=fork();
if(fpid==0)
printf("son/n");
else
printf("father/n");
}
return 0;
}
上面程序的循環中有個N,總結一下規律:對於這種N次循環的情況,執行printf函數的次數為2*(2^N-1)次,創建的子進程數為2^N-1個。
最后再上一份代碼:
#include <stdio.h>
#include <unistd.h>
int main(int argc, char* argv[])
{
fork();
fork() && fork() || fork();
fork();
return 0;
//printf(“+ \n”);
}
問題:不算main這個進程自身,程序到底創建了多少個進程?
答案:答案是總共20個進程,除去main進程,還有19個進程。
參考文章:
http://hi.baidu.com/passerryan/item/bbe792245816c61209750821
http://www.cnblogs.com/lq0729/archive/2011/10/24/2222536.html
http://blog.csdn.net/xiaoxi2xin/archive/2010/04/24/5524769.aspx
