【Linux】fork()函數總結，以及fork()引出的一些知識點

本文轉載自查看原文 2014-10-17 15:43 2124 linux/ fork()

1、進程相關概念

　　當一個進程的時間片用完后，系統把相關的寄存器的值保存到該進程表相應的表項里。同時把代替該進程即將執行的進程的上下文從進程表中讀出，並更新相應的寄存器值，這個過程稱為上下文交換。上下文交換其實就是讀出新的進程的PC(程序計數器),指示當前進程的下一條將要執行的指令。一個進程主要包含以下三個元素：(1)一個正在執行的程序；(2)與該進程相關聯的全部數據(變量，內存，緩沖區)；(3)程序上下文(程序計數器pc)

2、頭文件：

　　#include <unistd.h>

　　#include <types.h>

3、函數原型：

　　pid_t fork(void);

　　pid_t是一個宏，其實質是int類型，被定義在#include <sys/types.h>中；

　　返回值：1）成功：調用一次則返回兩個值：子進程返回0，父進程返回子進程的PID；

　　　　 2）失敗：返回-1；

4、獲取進程id：

　　getpid()、getppid()；

5、Fork過程

　　當前進程（調用者，父進程）調用fork()創建一個新的進程（子進程）。子進程是父進程的副本，它將獲得父進程數據空間、堆、棧（上下文）等資源的副本（注意：(1)子進程copy父進程的變量，內存與緩沖區，即整個的數據空間的內容，但數據空間是獨立的，即父子進程並不共享這些存儲空間。(2)父子進程對打開文件的共享: fork之后，子進程會繼承父進程所打開的文件表，即父子進程共享文件表，該文件表是由內核維護的，兩個進程共享文件狀態，偏移量等。這一點很重要，當在父進程中關閉文件時，子進程的文件描述符仍然有用，相應的文件表也不會被釋放。（3）為了提高效率，fork后並不立即復制父進程空間，采用了COW（Copy-On-Write）；當父子進程任意之一，要修改數據段、堆、棧時，進行復制操作，但僅復制修改區域；）。父子進程間共享的存儲空間只有代碼段（只讀的，且僅共享fork()后面的代碼段）。子進程和父進程繼續執行fork調用之后的指令。(4)fork之后，這兩個進程執行沒有固定的先后順序，哪個進程先執行要看系統的進程調度策略。

6、看一個程序：

#include<unistd.h>
#include<stdio.h>
int glob = 6;
char buf[] = "a write to stdout\n";
int  main(void)
{
        int var = 88;
        pid_t   pid;
        if (write(STDOUT_FILENO, buf, sizeof(buf)-1) != sizeof(buf)-1)
        {        
                printf("write error”);
        		return 0;
   		 }
        printf("before fork\n"); //注意這一行
        if ( (pid = fork()) < 0)
  	    {
                printf("fork error");
  		     	return 0;
   		 }
        else if (pid == 0) 
   		 {
                glob++;
                var++;
        } 
  		 else
   		 {
                sleep(2);
   		 }
        printf("pid = %d, glob = %d, var = %d\n", getpid(), glob, var);  
  		return 0;
}//fork_test.c

選擇輸出的方式不同，會有不同的輸出結果。

直接輸出到控制台：
a write to stdout
before fork
pid = 1867, glob = 7, var = 89
pid = 1866, glob = 6, var = 88
使用重定向：./fork_test >fork_test.txt，fork_test.txt內容如下：

a write to stdout
before fork
pid = 1939, glob = 7, var = 89
before fork
pid = 1938, glob = 6, var = 88

　　為什么會有這么大的不同？我們先來看看stdout與STDOUT_FILENO的區別（OS和C++的區別）。

　　stdin類型為 FILE*；STDIN_FILENO類型為 int。使用stdin的函數主要有：fread、fwrite、fclose等，基本上都以f開頭；使用STDIN_FILENO的函數有：read、write、close等。操作系統一級提供的文件API都是以文件描述符來表示文件，STDIN_FILENO就是標准輸入設備（一般是鍵盤）的文件描述符。標准C++一級提供的文件操作函數庫都是用FILE*來表示文件，stdin就是指向標准輸入設備文件的FILE*。

　　通過man stdin可以查看到：stdin, stdout, stderr - standard I/O streams（具體自行man）。

　　stdin / stdout / stderr 分別是指向stream的FILE型的指針變量。當程序啟動時，與其結合的整型文件描述符(fd)分別是0,1,2。STDIN_FILENO / STDOUT_FILENO / STDERR_FILENO 是在<unistd.h>文件中定義的預編譯macro。其值是0,1,2。(通過freopen(3)，可以改變與這3個文件描述符(fd)結合的stream值)。也就是說，程序啟動時：FILE * stdin / stdout / stderr 對應的文件描述符(fd)分別是 STDIN_FILENO(0) / STDOUT_FILENO(1) / STDERR_FILENO(2) 。但是，可以通過FILE *freopen(const char *path, const char *mode, FILE *stream); 來改變，使文件描述符(fd)對應到其他的stream上。(結合到哪個文件stream上，那個文件stream就是變成標准輸入輸出)。（標准輸入stdin/標准輸出stdout/error輸出stderr要分別改變。）

總結一句話：STDOUT_FILENO是OS提供的，定義在頭文件<unistd.h>中，沒有buffer（直接的系統調用）；FILE *stdout是標准C++提供的，定義在頭文件<stdio.h>中，有buffer。

使用stdin / stdout / stderr的函數主要有：fread、fwrite、fclose等，基本上都以f開頭。

使用STDIN_FILENO / STDOUT_FILENO / STDERR_FILENO的函數有：read、write、close等。

上程序：

#include<stdio.h>
#include<unistd.h>
#include<string.h>
#include<errno.h>
#define CHANGE_BY_FREOPEN /* 需要注釋掉，進行切換 */
int main(int argc,char**argv)
{
         char buf[]="hello,world\n";
	#ifdef CHANGE_BY_FREOPEN
	 freopen("stdout_text.txt","w",stdout);
  	//freopen("stderr_text.txt","w",stderr);/* stderr */
	#endif
  	printf("%s",buf);
 	fwrite(buf,strlen(buf), 1,stdout);
 	write(STDOUT_FILENO,&buf,strlen(buf));
  	perror("error out");/* stderr */
  	return 0;
}/* stdouttest.c */

編譯命令： gcc -o stdouttest stdouttest.c
①當 #define CHANGE_BY_FREOPEN 被注釋掉的時候：終端輸出的結果是：

hello，world

error out: Sucess

②當 #define CHANGE_BY_FREOPEN 有效的時候：終端輸出的結果是：

error out: Sucess

同時，會創建一個名為stdout_text.txt的文件，該文件中的內容是：

hello，world

hello，world
//freopen("stderr_text.txt","w",stderr);/* stderr */如果有效的話（）：①shell中，什么也不輸出。②stdout_text.txt 中，輸出3個(hello,world + 換行符)。③stderr_text.txt 中，輸出1個（error out: Success）。

接着stdout與STDOUT_FILENO的區別后，下面看下關於"printf"/"write"和緩沖的說明：

printf是在stdio.h中聲明的函數，而標准IO都是帶緩沖的，所以printf是帶緩沖的。而write則是不帶緩沖的。

標准IO在輸入或輸出到終端設備時，它們是行緩沖的，否則(文件)它們是全緩沖的。而標准錯誤流stderr是不使用緩沖的。更為准確的描述是：當且僅當標准輸入和標准輸出並不涉及交互式設備使，他們才是全緩沖的。標准出錯流不使用緩沖。下列情況會引發緩沖區的刷新(清空緩沖區)：

1、緩沖區滿時；
2、執行flush語句；
3、執行endl語句(printf是"\n")；
4、關閉文件。

綜上所述：write的內容在父進程直接輸出到了設備，“before fork”在主線程輸出到終端后因為換行符而清空了緩沖區，所以也只輸出了一次。而重定向到"a.txt"時，printf使用的是全緩沖，所以“before fork”並未輸出到設備，而是隨着fork()而被復制了一份到子進程的空間中，所以輸出了兩次。

注意：在重定向父進程輸出時，子進程也被重定向了。

另外：為什么父進程要等待2秒？在fork時，父進程所有打開的文件描述符都被復制一份到子進程中，然而他們共享文件描述符所指向的文件對象(FILE結構：描述文件讀寫指針，偏移量，標志等)。如果不等待，文件偏移量被交替修改，很可能產生混亂的輸出。（實際上，這么小的程序，進程執行是很快的，經過實際測試，這部分可以不用，不會產生混亂輸出。）

再看一個例子：

#include <stdio.h> 
#include <sys/types.h>
#include <sys/stat.h>
#include <string.h>
#include <sys/wait.h>
#include <unistd.h>
#include <fcntl.h>
#include <stdlib.h>
int main()
{
	pid_t childpid;
	char buf[100]={0};
	int status;//供wait使用的參數
	int f;//定義文件標識符
	f=open("text",O_CREAT|O_RDWR,0664);
	if(f==-1)//文件標識符
{
		perror("create file failed!");
		return 1;
	}
	strcpy(buf,"father process’s data\n");
	printf("%d\n",15);
	//此時創建子進程
	childpid=fork();
	printf("childpid=%d",childpid);
	if(childpid==0)
{	strcpy(buf,"child process’s data\n");
		printf("%s",buf);
		puts("child process is working");
		printf("child process’s PID is: %d\n",getpid());
		printf("father process’s PID is: %d\n",getppid());
		int n1= write(f,buf,strlen(buf));//把buf的數據輸出重定向到文件中去
		close(f);
		exit(0);//子進程調用exit函數進入僵死狀態,參數0表示正常退出
	}
	else {wait(&status);//wait函數是一個等待子進程退出的函數，其參數是一個int類型的指針，保存子進程退出的一些信息
		printf("%s/",buf);
puts("father process is working");
		printf("father process’s PID is: %d\n",getpid());
		printf("child process’s PID is: %d\n",childpid);
		int n=write(f,buf,strlen(buf));
		close(f);
	}
	return 0;
}

程序運行結果如下:

15//父進程打印出來的

Child process’s data

Child process is working

Child process’s PID is:4850

Father process’s PID is: 4849

Father process’s data

Father process is working

Father process’s PID is:4849

Child process’s PID is:4850
如果把 printf("%d/n",15); 改為printf("%d",15); ，那么運行的結果為:

15Child process’s data//15是子進程打印出來的

Child process is working

Child process’s PID is:4850

Father process’s PID is: 4849

15Father process’s data//15是父進程打印出來的

Father process is working

Father process’s PID is:4849

Child process’s PID is:4850

分析如下:

1.wait()函數阻塞父進程，直到子進程返回。因此，子進程先執行，直到退出為止。（當然，這里也可以用sleep(10)來完成同樣的功能）

函數說明：wait()會暫時停止目前進程的執行, 直到有信號來到或子進程結束. 如果在調用wait()時子進程已經結束, 則wait()會立即返回子進程結束狀態值. 子進程的結束狀態值會由參數status 返回, 而子進程的進程識別碼也會一快返回. 如果不在意結束狀態值, 則參數 status 可以設成NULL. 子進程的結束狀態值請參考waitpid().

2.為什么printf("%d/n",15); 與 printf("%d",15);打印的結果不相同?

printf("%d/n",15); 與 printf("%d",15); 區別:前者將數據已經輸出到終端上了，后者的數據還在緩沖區內。當創建子進程時，子進程要copy父進程的數據，包括copy緩沖區，所以，第一個程序只打印出一個15,而第二個程序打印出兩個15.還要注意一點，第一個結果的15是由父進程打印出來的，而第二個結果由於子進程先執行，復制緩沖區，所以子進程先打印出15，而后父進程才打印出15.

3. close(f),當子進程已經關閉了文件，父進程怎么還能將數據寫入?

在前面的分析中得知，父子進程共享同一個文件表，共享文件表的狀態，偏移位置等信息。所以在子進程關閉文件描述符后，在父進程中仍然是有效的，而父進程寫數據也從文件的當前位置開始寫。

而linux系統文件流，緩沖及文件描述符與進程之間的關系，可參考http://topic.csdn.net/u/20090309/18/3aba9e11-c8a8-492b-9fe7-29043974a102.html

再來幾個fork的小題目：

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>
#include <sys/types.h>
int main()
{
    pid_t   pid1;
    pid_t   pid2;
    pid1 = fork();
    pid2 = fork();
    printf("pid1=%d,pid2=%d\n",pid1,pid2);
    exit(0);
}

要求如下：已知從這個程序執行到這個程序的所有進程結束這個時間段內，沒有其它進程執行。
1、請說出執行這個程序后，一共運行了幾個進程。
2、如果其中一個進程的輸出結果是“pid1=1001, pid2=1002”，寫出其他進程的輸出結果（不考慮進程執行順序）。

答案：

1、一共執行了四個進程。（P0, P1, P2, P3）

2、另外幾個進程的輸出分別為：

pid1:1001, pid2:0

pid1:0, pid2:1003

pid1:0, pid2:0

#include <unistd.h>
#include <stdio.h> 
int main () 
{ 
	pid_t fpid; //fpid表示fork函數返回的值
	int count=0;
	fpid=fork(); 
	if (fpid < 0) 
		printf("error in fork!"); 
	else if (fpid == 0) {
		printf("i am the child process, my process id is %d\n",getpid()); 
		printf("我是爹的兒子\n");//對某些人來說中文看着更直白。
		count++;
	}
	else {
		printf("i am the parent process, my process id is %d\n",getpid()); 
		printf("我是孩子他爹\n");
		count++;
	}
	printf("統計結果是: %d\n",count);
	return 0;
}

運行結果是：
    i am the child process, my process id is 5574
    我是爹的兒子
    統計結果是: 1
    i am the parent process, my process id is 5573
    我是孩子他爹
    統計結果是: 1

#include <unistd.h>
#include <stdio.h>
int main(void)
{
   int i=0;
   for(i=0;i<2;i++){
       pid_t fpid=fork();
       if(fpid==0)
    	   printf("%d child  %4d %4d %4d/n",i,getppid(),getpid(),fpid);
       else
    	   printf("%d father%4d %4d %4d/n",i,getppid(),getpid(),fpid);
   }
   return 0;
}

程序運行結果：

0 father 1958 4982 4983 第一行（P0當i=0時執行fork()后進入else產生的）

1 father 1958 4982 4984 第二行（P0當i=1時執行fork()后進入else產生的）

0 child 4982 4983 0 第三行（P0當i=0時執行fork()后進入if產生的）

1 child 4982 4984 0 第四行（P0當i=1時執行fork()后進入if產生的）

1 father 4982 4983 4985 第五行（P1當i=1時執行fork()后進入else產生的）

1 child 1 4985 0 第六行（P1當i=1時執行fork()后進入if產生的）

分析如下：

假設主程序原來的進程為P0。

當i=0時，程序進入循環，P0調用fork()，隨后產生出P1，在P0中fork()返回的fpid是子進程的PID，所以fpid不為0，此時判斷語句進入else，所以會有第一行；在P1中fork()返回的fpid是0，此時判斷語句進入if，所以會有第三行。

當i=1時，（以下P0與P1沒有先后順序，主要看OS的策略）P0再次調用fork()，隨后產生出P2，在P0中fork()返回fpid!=0，進入else，所以會有第二行；在P2中fork()返回fpid=0，進入if，所以會有第四行。另外，i=0時產生的P1也會調用fork()，隨后產生出P3，在P1中fork()返回fpid!=0，進入else，所以會有第五行；在P2中fork()返回fpid=0，進入if，所以會有第六行。

上面值得注意的是第六行中的getppid()值為1。按照上面的分析，按說4985的父進程應該4983嗎？怎么會是1呢？這里得講到進程的創建和死亡的過程，進程4983執行完第二個循環后，main函數就該退出了，也即進程該死亡了，因為它已經做完所有事情了。4983死亡后，4985就沒有父進程了，這在操作系統是不被允許的，所以4985的父進程就被置為init了，init是永遠不會死亡的。看下面的linux父子進程終止的先后順序不同產生不同的結果：

1）父進程先於子進程終止：

此種情況就是孤兒進程。當父進程先退出時，系統會讓init進程接管子進程。
2）子進程先於父進程終止，而父進程又沒有調用wait或waitpid函數

此種情況子進程進入僵死狀態，且會一直保持下去直到系統重啟。子進程處於僵死狀態時，內核只保存進程的一些必要信息以備父進程所需。此時子進程始終占有着資源，同時也減少了系統可以創建的最大進程數。

僵死狀態：一個已經終止、但是其父進程尚未對其進行善后處理(獲取終止子進程的有關信息，釋放它仍占有的資源)的進程被稱為僵死進程(zombie)。ps命令將僵死進程的狀態打印為Z 。
3）子進程先於父進程終止，而父進程調用了wait或waitpid函數
此時父進程會等待子進程結束。

那么有人可能會問：4983執行完后結束了，從而導致4985沒有了父進程；同樣，4982在第二次循環執行完后也結束了，不是也應該導致4984沒有了父進程了嗎？為什么第四行中的getppid()不是1？這其實在上面提到過，就是因為操作系統調度的問題。理論上來說，第四行和第六行的getppid()“都有可能為1”。

#include <unistd.h>
#include <stdio.h>
int main(void)
{
   int i=0;
   for(i=0;i<N;i++){
       pid_t fpid=fork();
       if(fpid==0)
    	   printf("son/n");
       else
    	   printf("father/n");
   }
   return 0;
}

上面程序的循環中有個N，總結一下規律：對於這種N次循環的情況，執行printf函數的次數為2*(2^N-1)次，創建的子進程數為2^N-1個。

最后再上一份代碼：

#include <stdio.h>
#include <unistd.h>
int main(int argc, char* argv[])
{
   fork();
   fork() && fork() || fork();
   fork();
   return 0;
   //printf(“+ \n”);
}

問題：不算main這個進程自身，程序到底創建了多少個進程？

答案：答案是總共20個進程，除去main進程，還有19個進程。

參考文章：

http://hi.baidu.com/passerryan/item/bbe792245816c61209750821

http://www.cnblogs.com/lq0729/archive/2011/10/24/2222536.html

http://blog.csdn.net/xiaoxi2xin/archive/2010/04/24/5524769.aspx

http://blog.csdn.net/chenjin_zhong/article/details/6099228

http://blog.csdn.net/jason314/article/details/5640969

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 一些..C#知識點總結關於集合中一些常考的知識點總結關於Sql Server的一些知識點的定義總結 fork函數總結 Linux中的fork函數 ElasticSearch（八）關於document的一些知識點 CGI的一些知識點關於SVM的一些知識點一些知識點的整理 ps一些疑問知識點