Linux下的進程間通信-詳解

semget()

可以使用系統調用semget()創建一個新的信號量集，或者存取一個已經存在的信號量集：

系統調用：semget();
原型：intsemget(key_t key,int nsems,int semflg);
返回值：如果成功，則返回信號量集的IPC標識符。如果失敗，則返回-1：errno=EACCESS(沒有權限)
EEXIST(信號量集已經存在，無法創建)
EIDRM(信號量集已經刪除)
ENOENT(信號量集不存在，同時沒有使用IPC_CREAT)
ENOMEM(沒有足夠的內存創建新的信號量集)
ENOSPC(超出限制)

系統調用semget()的第一個參數是關鍵字值（一般是由系統調用ftok()返回的）。系統內核將此值和系統中存在的其他的信號量集的關鍵字值進行比較。打開和存取操作與參數semflg中的內容相關。IPC_CREAT如果信號量集在系統內核中不存在，則創建信號量集。IPC_EXCL當和 IPC_CREAT一同使用時，如果信號量集已經存在，則調用失敗。如果單獨使用IPC_CREAT，則semget()要么返回新創建的信號量集的標識符，要么返回系統中已經存在的同樣的關鍵字值的信號量的標識符。如果IPC_EXCL和IPC_CREAT一同使用，則要么返回新創建的信號量集的標識符，要么返回-1。IPC_EXCL單獨使用沒有意義。參數nsems指出了一個新的信號量集中應該創建的信號量的個數。信號量集中最多的信號量的個數是在linux/sem.h中定義的：

#defineSEMMSL32/*<=512maxnumofsemaphoresperid*/
下面是一個打開和創建信號量集的程序：
intopen_semaphore_set(key_t keyval,int numsems)
{
intsid;
if(!numsems)
return(-1);
if((sid=semget(mykey,numsems,IPC_CREAT|0660))==-1)
{
return(-1);
}
return(sid);
}
};

==============================================================

semop()

系統調用：semop();
調用原型：int semop(int semid,struct sembuf*sops,unsign ednsops);
返回值：0，如果成功。-1，如果失敗：errno=E2BIG(nsops大於最大的ops數目)
EACCESS(權限不夠)
EAGAIN(使用了IPC_NOWAIT，但操作不能繼續進行)
EFAULT(sops指向的地址無效)
EIDRM(信號量集已經刪除)
EINTR(當睡眠時接收到其他信號)
EINVAL(信號量集不存在,或者semid無效)
ENOMEM(使用了SEM_UNDO,但無足夠的內存創建所需的數據結構)
ERANGE(信號量值超出范圍)

第一個參數是關鍵字值。第二個參數是指向將要操作的數組的指針。第三個參數是數組中的操作的個數。參數sops指向由sembuf組成的數組。此數組是在linux/sem.h中定義的：

/*semop systemcall takes an array of these*/
structsembuf{
ushortsem_num;/*semaphore index in array*/
shortsem_op;/*semaphore operation*/
shortsem_flg;/*operation flags*/
sem_num將要處理的信號量的個數。
sem_op要執行的操作。
sem_flg操作標志。

如果sem_op是負數，那么信號量將減去它的值。這和信號量控制的資源有關。如果沒有使用IPC_NOWAIT，那么調用進程將進入睡眠狀態，直到信號量控制的資源可以使用為止。如果sem_op是正數，則信號量加上它的值。這也就是進程釋放信號量控制的資源。最后，如果sem_op是0，那么調用進程將調用sleep()，直到信號量的值為0。這在一個進程等待完全空閑的資源時使用。

===============================================================

semctl()

系統調用：semctl();
原型：int semctl(int semid,int semnum,int cmd,union semunarg);
返回值：如果成功，則為一個正數。
如果失敗，則為-1：errno=EACCESS(權限不夠)
EFAULT(arg指向的地址無效)
EIDRM(信號量集已經刪除)
EINVAL(信號量集不存在，或者semid無效)
EPERM(EUID沒有cmd的權利)
ERANGE(信號量值超出范圍)

系統調用semctl用來執行在信號量集上的控制操作。這和在消息隊列中的系統調用msgctl是十分相似的。但這兩個系統調用的參數略有不同。因為信號量一般是作為一個信號量集使用的，而不是一個單獨的信號量。所以在信號量集的操作中，不但要知道IPC關鍵字值，也要知道信號量集中的具體的信號量。這兩個系統調用都使用了參數cmd，它用來指出要操作的具體命令。兩個系統調用中的最后一個參數也不一樣。在系統調用msgctl中，最后一個參數是指向內核中使用的數據結構的指針。我們使用此數據結構來取得有關消息隊列的一些信息，以及設置或者改變隊列的存取權限和使用者。但在信號量中支持額外的可選的命令，這樣就要求有一個更為復雜的數據結構。
系統調用semctl()的第一個參數是關鍵字值。第二個參數是信號量數目。

    參數cmd中可以使用的命令如下：
    ·IPC_STAT讀取一個信號量集的數據結構semid_ds，並將其存儲在semun中的buf參數中。
    ·IPC_SET設置信號量集的數據結構semid_ds中的元素ipc_perm，其值取自semun中的buf參數。
    ·IPC_RMID將信號量集從內存中刪除。
    ·GETALL用於讀取信號量集中的所有信號量的值。
    ·GETNCNT返回正在等待資源的進程數目。
    ·GETPID返回最后一個執行semop操作的進程的PID。
    ·GETVAL返回信號量集中的一個單個的信號量的值。
    ·GETZCNT返回這在等待完全空閑的資源的進程數目。
    ·SETALL設置信號量集中的所有的信號量的值。
    ·SETVAL設置信號量集中的一個單獨的信號量的值。

參數arg代表一個semun的實例。semun是在linux/sem.h中定義的：
/*arg for semctl systemcalls.*/
unionsemun{
intval;/*value for SETVAL*/
structsemid_ds*buf;/*buffer for IPC_STAT&IPC_SET*/
ushort*array;/*array for GETALL&SETALL*/
structseminfo*__buf;/*buffer for IPC_INFO*/
void*__pad;

val當執行SETVAL命令時使用。buf在IPC_STAT/IPC_SET命令中使用。代表了內核中使用的信號量的數據結構。array在使用GETALL/SETALL命令時使用的指針。
下面的程序返回信號量的值。當使用GETVAL命令時，調用中的最后一個參數被忽略：

intget_sem_val(intsid,intsemnum)
{
return(semctl(sid,semnum,GETVAL,0));
}

下面是一個實際應用的例子：

#defineMAX_PRINTERS5
printer_usage()
{
int x;
for(x=0;x<MAX_PRINTERS;x++)
printf("Printer%d:%d/n/r",x,get_sem_val(sid,x));
}

下面的程序可以用來初始化一個新的信號量值：

void init_semaphore(int sid,int semnum,int initval)
{
union semunsemopts;
semopts.val=initval;
semctl(sid,semnum,SETVAL,semopts);
}

注意系統調用semctl中的最后一個參數是一個聯合類型的副本，而不是一個指向聯合類型的指針。

　　 2.3.5 套接口
　　套接口（socket）編程是實現Linux系統和其他大多數操作系統中進程間通信的主要方式之一。我們熟知的WWW服務、FTP服務、TELNET服務等都是基於套接口編程來實現的。除了在異地的計算機進程間以外，套接口同樣適用於本地同一台計算機內部的進程間通信。關於套接口的經典教材同樣是 Richard Stevens編著的《Unix網絡編程：聯網的API和套接字》，清華大學出版社出版了該書的影印版。它同樣是Linux程序員的必備書籍之一。
　　關於這一部分的內容，可以參照本文作者的另一篇文章《設計自己的網絡螞蟻》，那里由常用的幾個套接口函數的介紹和示例程序。這一部分或許是Linux進程間通信編程中最須關注和最吸引人的一部分，畢竟，Internet 正在我們身邊以不可思議的速度發展着，如果一個程序員在設計編寫他下一個程序的時候，根本沒有考慮到網絡，考慮到Internet，那么，可以說，他的設計很難成功。

3 Linux的進程和Win32的進程/線程比較
　　熟悉WIN32編程的人一定知道，WIN32的進程管理方式與Linux上有着很大區別，在UNIX里，只有進程的概念，但在WIN32里卻還有一個"線程"的概念，那么Linux和WIN32在這里究竟有着什么區別呢？
　　 WIN32里的進程/線程是繼承自OS/2的。在WIN32里，"進程"是指一個程序，而"線程"是一個"進程"里的一個執行"線索"。從核心上講， WIN32的多進程與Linux並無多大的區別，在WIN32里的線程才相當於Linux的進程，是一個實際正在執行的代碼。但是，WIN32里同一個進程里各個線程之間是共享數據段的。這才是與Linux的進程最大的不同。
　　下面這段程序顯示了WIN32下一個進程如何啟動一個線程。

int g;
DWORD WINAPI ChildProcess( LPVOID lpParameter ){
int i;
for ( i = 1; i <1000; i ++) {
g ++;
printf( "This is Child Thread: %d/n", g );
}
ExitThread( 0 );
};

void main()
{
int threadID;
int i;
g = 0;
CreateThread( NULL, 0, ChildProcess, NULL, 0, &threadID );
for ( i = 1; i <1000; i ++) {
g ++;
printf( "This is Parent Thread: %d/n", g );
}
}

　　在WIN32下，使用CreateThread函數創建線程，與Linux下創建進程不同，WIN32線程不是從創建處開始運行的，而是由 CreateThread指定一個函數，線程就從那個函數處開始運行。此程序同前面的UNIX程序一樣，由兩個線程各打印1000條信息。 threadID是子線程的線程號，另外，全局變量g是子線程與父線程共享的，這就是與Linux最大的不同之處。大家可以看出，WIN32的進程/線程要比Linux復雜，在Linux要實現類似WIN32的線程並不難，只要fork以后，讓子進程調用ThreadProc函數，並且為全局變量開設共享數據區就行了，但在WIN32下就無法實現類似fork的功能了。所以現在WIN32下的C語言編譯器所提供的庫函數雖然已經能兼容大多數 Linux/UNIX的庫函數，但卻仍無法實現fork。
　　對於多任務系統，共享數據區是必要的，但也是一個容易引起混亂的問題，在WIN32下，一個程序員很容易忘記線程之間的數據是共享的這一情況，一個線程修改過一個變量后，另一個線程卻又修改了它，結果引起程序出問題。但在Linux下，由於變量本來並不共享，而由程序員來顯式地指定要共享的數據，使程序變得更清晰與安全。
至於WIN32的"進程"概念，其含義則是"應用程序"，也就是相當於UNIX下的exec了。
　　 Linux也有自己的多線程函數pthread，它既不同於Linux的進程，也不同於WIN32下的進程，關於pthread的介紹和如何在Linux環境下編寫多線程程序我們將在另一篇文章《Linux下的多線程編程》中講述。

Linux下的進程間通信-詳解

免責聲明！