線程概念
什么是線程
LWP:light weight process 輕量級的進程,本質仍是進程(在Linux環境下)
進程:獨立地址空間,擁有PCB
線程:也有PCB,但沒有獨立的地址空間(共享)
區別:在於是否共享地址空間。 獨居(進程);合租(線程)。
Linux下: 線程:最小的執行單位
進程:最小分配資源單位,可看成是只有一個線程的進程。
Linux內核線程實現原理
類Unix系統中,早期是沒有“線程”概念的,80年代才引入,借助進程機制實現出了線程的概念。因此在這類系統中,進程和線程關系密切。
1. 輕量級進程(light-weight process),也有PCB,創建線程使用的底層函數和進程一樣,都是clone
2. 從內核里看進程和線程是一樣的,都有各自不同的PCB,但是PCB中指向內存資源的三級頁表是相同的
3. 進程可以蛻變成線程
4. 線程可看做寄存器和棧的集合
5. 在linux下,線程最是小的執行單位;進程是最小的分配資源單位
察看LWP號:ps –Lf pid 查看指定線程的lwp號。
三級映射:進程PCB --> 頁目錄(可看成數組,首地址位於PCB中) --> 頁表 --> 物理頁面 --> 內存單元
參考:《Linux內核源代碼情景分析》 ----毛德操
對於進程來說,相同的地址(同一個虛擬地址)在不同的進程中,反復使用而不沖突。原因是他們雖虛擬址一樣,但,頁目錄、頁表、物理頁面各不相同。相同的虛擬址,映射到不同的物理頁面內存單元,最終訪問不同的物理頁面。
但!線程不同!兩個線程具有各自獨立的PCB,但共享同一個頁目錄,也就共享同一個頁表和物理頁面。所以兩個PCB共享一個地址空間。
實際上,無論是創建進程的fork,還是創建線程的pthread_create,底層實現都是調用同一個內核函數clone。
如果復制對方的地址空間,那么就產出一個“進程”;如果共享對方的地址空間,就產生一個“線程”。
因此:Linux內核是不區分進程和線程的。只在用戶層面上進行區分。所以,線程所有操作函數 pthread_* 是庫函數,而非系統調用。
線程共享資源
1.文件描述符表
2.每種信號的處理方式
3.當前工作目錄
4.用戶ID和組ID
5.內存地址空間 (.text/.data/.bss/heap/共享庫)
線程非共享資源
1.線程id
2.處理器現場和棧指針(內核棧)
3.獨立的棧空間(用戶空間棧)
4.errno變量
5.信號屏蔽字
6.調度優先級
線程優、缺點
優點: 1. 提高程序並發性 2. 開銷小 3. 數據通信、共享數據方便
缺點: 1. 庫函數,不穩定 2. 調試、編寫困難、gdb不支持 3. 對信號支持不好
優點相對突出,缺點均不是硬傷。Linux下由於實現方法導致進程、線程差別不是很大。
線程控制原語
pthread_self函數
獲取線程ID。其作用對應進程中 getpid() 函數。
pthread_t pthread_self(void); 返回值:成功:0; 失敗:無!
線程ID:pthread_t類型,本質:在Linux下為無符號整數(%lu),其他系統中可能是結構體實現
線程ID是進程內部,識別標志。(兩個進程間,線程ID允許相同)
注意:不應使用全局變量 pthread_t tid,在子線程中通過pthread_create傳出參數來獲取線程ID,而應使用pthread_self。
pthread_create函數
創建一個新線程。 其作用,對應進程中fork() 函數。
int pthread_create(pthread_t *thread, const pthread_attr_t *attr, void *(*start_routine) (void *), void *arg);
返回值:成功:0; 失敗:錯誤號 -----Linux環境下,所有線程特點,失敗均直接返回錯誤號。
參數:
pthread_t:當前Linux中可理解為:typedef unsigned long int pthread_t。
1. 傳出參數,保存系統為我們分配好的線程ID
2. 通常傳NULL,表示使用線程默認屬性。若想使用具體屬性也可以修改該參數。
3. 函數指針,指向線程主函數(線程體),該函數運行結束,則線程結束。
4. 線程主函數執行期間所使用的參數。
在一個線程中調用pthread_create()創建新的線程后,當前線程從pthread_create()返回繼續往下執行,而新的線程所執行的代碼由我們傳給pthread_create的函數指針start_routine決定。start_routine函數接收一個參數,是通過pthread_create的arg參數傳遞給它的,該參數的類型為void *,這個指針按什么類型解釋由調用者自己定義。start_routine的返回值類型也是void *,這個指針的含義同樣由調用者自己定義。start_routine返回時,這個線程就退出了,其它線程可以調用pthread_join得到start_routine的返回值,類似於父進程調用wait(2)得到子進程的退出狀態,稍后詳細介紹pthread_join。
pthread_create成功返回后,新創建的線程的id被填寫到thread參數所指向的內存單元。我們知道進程id的類型是pid_t,每個進程的id在整個系統中是唯一的,調用getpid(2)可以獲得當前進程的id,是一個正整數值。線程id的類型是thread_t,它只在當前進程中保證是唯一的,在不同的系統中thread_t這個類型有不同的實現,它可能是一個整數值,也可能是一個結構體,也可能是一個地址,所以不能簡單地當成整數用printf打印,調用pthread_self(3)可以獲得當前線程的id。
attr參數表示線程屬性,本節不深入討論線程屬性,所有代碼例子都傳NULL給attr參數,表示線程屬性取缺省值,感興趣的讀者可以參考APUE。
例:創建一個新線程,打印線程ID。注意:鏈接線程庫 -lpthread 【pthrd_crt.c】
#include <stdio.h> #include <pthread.h> #include <unistd.h> void *tfn(void *arg) { printf("I'm thread, Thread_ID = %lu\n", pthread_self()); return NULL; } int main(void) { pthread_t tid; pthread_create(&tid, NULL, tfn, NULL); sleep(1); printf("I am main, my pid = %d\n", getpid()); return 0; }
由於pthread_create的錯誤碼不保存在errno中,因此不能直接用perror(3)打印錯誤信息,可以先用strerror(3)把錯誤碼轉換成錯誤信息再打印。如果任意一個線程調用了exit或_exit,則整個進程的所有線程都終止,由於從main函數return也相當於調用exit,為了防止新創建的線程還沒有得到執行就終止,我們在main函數return之前延時1秒,這只是一種權宜之計,即使主線程等待1秒,內核也不一定會調度新創建的線程執行,下一節我們會看到更好的辦法。
例:循環創建多個線程,每個線程打印自己是第幾個被創建的線程。(類似於進程循環創建子進程) 【more_pthrd.c】
#include <pthread.h> #include <stdio.h> #include <unistd.h> #include <stdlib.h> void *tfn(void *arg) { int i; i = (int)arg; sleep(i); //通過i來區別每個線程 printf("I'm %dth thread, Thread_ID = %lu\n", i+1, pthread_self()); return NULL; } int main(int argc, char *argv[]) { int n = 5, i; pthread_t tid; if (argc == 2) n = atoi(argv[1]); for (i = 0; i < n; i++) { pthread_create(&tid, NULL, tfn, (void *)i); //將i轉換為指針,在tfn中再強轉回整形。 } sleep(n); printf("I am main, and I am not a process, I'm a thread!\n" "main_thread_ID = %lu\n", pthread_self()); pthread_exit(NULL); }
拓展思考:將pthread_create函數參4修改為(void *)&i, 將線程主函數內改為 i=*((int *)arg) 是否可以。
答:不可以,因為i取得的是地址空間中的值,取出來的可能不是想象的數據了
線程與共享
【牢記】:線程默認共享數據段、代碼段等地址空間,常用的是全局變量。而進程不共享全局變量,只能借助mmap。
例:設計程序,驗證線程之間共享全局數據。 【glb_var_pthrd.c】
#include <stdio.h> #include <pthread.h> #include <stdlib.h> #include <unistd.h> int var = 100; void *tfn(void *arg) { var = 200; printf("thread\n"); return NULL; } int main(void) { printf("At first var = %d\n", var); pthread_t tid; pthread_create(&tid, NULL, tfn, NULL); sleep(1); printf("after pthread_create, var = %d\n", var); return 0; }
pthread_exit函數
將單個線程退出
void pthread_exit(void *retval); 參數:retval表示線程退出狀態,通常傳NULL
例:使用exit將指定線程退出,可以嗎? 【pthrd_exit.c】
#include <pthread.h> #include <stdio.h> #include <unistd.h> #include <stdlib.h> void *tfn(void *arg) { int i; i = (int)arg;//強轉。 if (i == 2) pthread_exit(NULL); sleep(i); //通過i來區別每個線程 printf("I'm %dth thread, Thread_ID = %lu\n", i+1, pthread_self()); return NULL; } int main(int argc, char *argv[]) { int n = 5, i; pthread_t tid; if (argc == 2) n = atoi(argv[1]); for (i = 0; i < n; i++) { pthread_create(&tid, NULL, tfn, (void *)i); //將i轉換為指針,在tfn中再強轉回整形。 } sleep(n); printf("I am main, I'm a thread!\n" "main_thread_ID = %lu\n", pthread_self()); return 0; }
結論:線程中,禁止使用exit函數,會導致進程內所有線程全部退出。
在不添加sleep控制輸出順序的情況下。pthread_create在循環中,幾乎瞬間創建5個線程,但只有第1個線程有機會輸出(或者第2個也有,也可能沒有,取決於內核調度)如果第3個線程執行了exit,將整個進程退出了,所以全部線程退出了。
所以,多線程環境中,應盡量少用,或者不使用exit函數,取而代之使用pthread_exit函數,將單個線程退出。任何線程里exit導致進程退出,其他線程未工作結束,主控線程退出時不能return或exit。
另注意,pthread_exit或者return返回的指針所指向的內存單元必須是全局的或者是用malloc分配的,不能在線程函數的棧上分配,因為當其它線程得到這個返回指針時線程函數已經退出了。
例:編寫多線程程序,總結exit、return、pthread_exit各自退出效果。
return:返回到調用者那里去。
pthread_exit():將調用該函數的線程退出
exit: 將進程退出。
pthread_join函數
阻塞等待線程退出,獲取線程退出狀態 其作用,對應進程中 waitpid() 函數。
int pthread_join(pthread_t thread, void **retval); 成功:0;失敗:錯誤號
參數:thread:線程ID (【注意】:不是指針);retval:存儲線程結束狀態。
對比記憶:
進程中:main返回值、exit參數-->int;等待子進程結束 wait 函數參數-->int *
線程中:線程主函數返回值、pthread_exit-->void *;等待線程結束 pthread_join 函數參數-->void **
例:參數 retval 非空用法。 【pthrd_exit_join.c】
#include <stdio.h> #include <unistd.h> #include <pthread.h> #include <stdlib.h> typedef struct{ int a; int b; } exit_t; void *tfn(void *arg) { exit_t *ret; ret = malloc(sizeof(exit_t)); ret->a = 100; ret->b = 300; pthread_exit((void *)ret); return NULL; //should not be here. } int main(void) { pthread_t tid; exit_t *retval; pthread_create(&tid, NULL, tfn, NULL); /*調用pthread_join可以獲取線程的退出狀態*/ pthread_join(tid, (void **)&retval); printf("a = %d, b = %d \n", retval->a, retval->b); return 0; }
調用該函數的線程將掛起等待,直到id為thread的線程終止。thread線程以不同的方法終止,通過pthread_join得到的終止狀態是不同的,總結如下:
- 如果thread線程通過return返回,retval所指向的單元里存放的是thread線程函數的返回值。
- 如果thread線程被別的線程調用pthread_cancel異常終止掉,retval所指向的單元里存放的是常數PTHREAD_CANCELED。
- 如果thread線程是自己調用pthread_exit終止的,retval所指向的單元存放的是傳給pthread_exit的參數。
- 如果對thread線程的終止狀態不感興趣,可以傳NULL給retval參數。
例】:使用pthread_join函數將循環創建的多個子線程回收。 【pthrd_loop_join.c】
#include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <pthread.h> int var = 100; void *tfn(void *arg) { int i; i = (int)arg; sleep(i); if (i == 1) { //i = 0 100 333 333 777 777 var = 333; printf("var = %d\n", var); pthread_exit((void *)var); } else if (i == 3) { var = 777; printf("I'm %dth pthread, pthread_id = %lu\n var = %d\n", i+1, pthread_self(), var); pthread_exit((void *)var); } else { printf("I'm %dth pthread, pthread_id = %lu\n var = %d\n", i+1, pthread_self(), var); pthread_exit((void *)var); } return NULL; } int main(void) { pthread_t tid[5]; int i, *ret[5]; for (i = 0; i < 5; i++) pthread_create(&tid[i], NULL, tfn, (void *)i); for (i = 0; i < 5; i++) { pthread_join(tid[i], (void **)&ret[i]); printf("-------%d 's ret = %d\n", i, (int)ret[i]); } printf("I'm main pthread tid = %lu\t var = %d\n", pthread_self(), var); pthread_exit(NULL); }
pthread_detach函數
實現線程分離
int pthread_detach(pthread_t thread); 成功:0;失敗:錯誤號
線程分離狀態:指定該狀態,線程主動與主控線程斷開關系。線程結束后,其退出狀態不由其他線程獲取,而直接自己自動釋放。網絡、多線程服務器常用。
進程若有該機制,將不會產生僵屍進程。僵屍進程的產生主要由於進程死后,大部分資源被釋放,一點殘留資源仍存於系統中,導致內核認為該進程仍存在。
也可使用 pthread_create函數參2(線程屬性)來設置線程分離。
例:使用pthread_detach函數實現線程分離 【pthrd_detach.c】
#include <stdio.h> #include <stdlib.h> #include <pthread.h> #include <unistd.h> #include <string.h> void *tfn(void *arg) { int n = 3; while (n--) { printf("thread count %d\n", n); sleep(1); } return (void *)1; } int main(void) { pthread_t tid; void *tret; int err; #if 1 pthread_attr_t attr; /*通過線程屬性來設置游離態*/ pthread_attr_init(&attr); pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED); pthread_create(&tid, &attr, tfn, NULL); pthread_attr_destroy(&attr); #else pthread_create(&tid, NULL, tfn, NULL); pthread_detach(tid); #endif while (1) { err = pthread_join(tid, &tret); if (err != 0) fprintf(stderr, "thread %s\n", strerror(err)); else fprintf(stderr, "thread exit code %d\n", (int)tret); sleep(1); } return 0; }
一般情況下,線程終止后,其終止狀態一直保留到其它線程調用pthread_join獲取它的狀態為止。但是線程也可以被置為detach狀態,這樣的線程一旦終止就立刻回收它占用的所有資源,而不保留終止狀態。不能對一個已經處於detach狀態的線程調用pthread_join,這樣的調用將返回EINVAL。如果已經對一個線程調用了pthread_detach就不能再調用pthread_join了。
pthread_cancel函數
殺死(取消)線程 其作用,對應進程中 kill() 函數。
int pthread_cancel(pthread_t thread); 成功:0;失敗:錯誤號
【注意】:線程的取消並不是實時的,而又一定的延時。需要等待線程到達某個取消點(檢查點)。
類似於玩游戲存檔,必須到達指定的場所(存檔點,如:客棧、倉庫、城里等)才能存儲進度。殺死線程也不是立刻就能完成,必須要到達取消點。
取消點:是線程檢查是否被取消,並按請求進行動作的一個位置。通常是一些系統調用creat,open,pause,close,read,write..... ——參 APUE.12.7 取消選項。
可粗略認為一個系統調用(進入內核)即為一個取消點。
被取消的線程,退出值,定義在Linux的pthread庫中常數PTHREAD_CANCELED的值是-1。可以在頭文件pthread.h中找到它的定義:#define PTHREAD_CANCELED ((void *) -1)
例:終止線程的三種方法。注意“取消點”的概念。 【pthrd_endof3.c】
#include <stdio.h> #include <unistd.h> #include <pthread.h> #include <stdlib.h> void *tfn1(void *arg) { printf("thread 1 returning\n"); return (void *)111; } void *tfn2(void *arg) { printf("thread 2 exiting\n"); pthread_exit((void *)222); } void *tfn3(void *arg) { while (1) { // printf("thread 3: I'm going to die 1 seconds after...\n"); // sleep(1); pthread_testcancel(); //自己添加取消點 } } int main(void) { pthread_t tid; void *tret = NULL; pthread_create(&tid, NULL, tfn1, NULL); pthread_join(tid, &tret); printf("thread 1 exit code = %d\n\n", (int)tret); pthread_create(&tid, NULL, tfn2, NULL); pthread_join(tid, &tret); printf("thread 2 exit code = %d\n\n", (int)tret); pthread_create(&tid, NULL, tfn3, NULL); sleep(3); pthread_cancel(tid); pthread_join(tid, &tret); printf("thread 3 exit code = %d\n", (int)tret); return 0; }
終止線程方式
總結:終止某個線程而不終止整個進程,有三種方法:
- 從線程主函數return。這種方法對主控線程不適用,從main函數return相當於調用exit。
- 一個線程可以調用pthread_cancel終止同一進程中的另一個線程。
- 線程可以調用pthread_exit終止自己。
pthread_equal函數
比較兩個線程ID是否相等。
int pthread_equal(pthread_t t1, pthread_t t2);
有可能Linux在未來線程ID pthread_t 類型被修改為結構體實現。
控制原語對比
進程 線程
fork pthread_create
exit pthread_exit
wait pthread_join
kill pthread_cancel
getpid pthread_self 命名空間
線程屬性
本節作為指引性介紹,linux下線程的屬性是可以根據實際項目需要,進行設置,之前我們討論的線程都是采用線程的默認屬性,默認屬性已經可以解決絕大多數開發時遇到的問題。如我們對程序的性能提出更高的要求那么需要設置線程屬性,比如可以通過設置線程棧的大小來降低內存的使用,增加最大線程個數。
typedef struct
{
int etachstate; //線程的分離狀態
int schedpolicy; //線程調度策略
struct sched_param schedparam; //線程的調度參數
int inheritsched; //線程的繼承性
int scope; //線程的作用域
size_t guardsize; //線程棧末尾的警戒緩沖區大小
int stackaddr_set; //線程的棧設置
void* stackaddr; //線程棧的位置
size_t stacksize; //線程棧的大小
} pthread_attr_t;
主要結構體成員:
1. 線程分離狀態
2. 線程棧大小(默認平均分配)
3. 線程棧警戒緩沖區大小(位於棧末尾) 參 APUE.12.3 線程屬性
4. 線程棧最低地址
屬性值不能直接設置,須使用相關函數進行操作,初始化的函數為pthread_attr_init,這個函數必須在pthread_create函數之前調用。之后須用pthread_attr_destroy函數來釋放資源。
線程屬性主要包括如下屬性:作用域(scope)、棧尺寸(stack size)、棧地址(stack address)、優先級(priority)、分離的狀態(detached state)、調度策略和參數(scheduling policy and parameters)。默認的屬性為非綁定、非分離、缺省的堆棧、與父進程同樣級別的優先級。
線程屬性初始化
注意:應先初始化線程屬性,再pthread_create創建線程
初始化線程屬性
int pthread_attr_init(pthread_attr_t *attr); 成功:0;失敗:錯誤號
銷毀線程屬性所占用的資源
int pthread_attr_destroy(pthread_attr_t *attr); 成功:0;失敗:錯誤號
線程的分離狀態
線程的分離狀態決定一個線程以什么樣的方式來終止自己。
非分離狀態:線程的默認屬性是非分離狀態,這種情況下,原有的線程等待創建的線程結束。只有當pthread_join()函數返回時,創建的線程才算終止,才能釋放自己占用的系統資源。
分離狀態:分離線程沒有被其他的線程所等待,自己運行結束了,線程也就終止了,馬上釋放系統資源。應該根據自己的需要,選擇適當的分離狀態。
線程分離狀態的函數:
設置線程屬性,分離or非分離
int pthread_attr_setdetachstate(pthread_attr_t *attr, int detachstate);
獲取程屬性,分離or非分離
pthread_attr_getdetachstate(pthread_attr_t *attr, int *detachstate);
參數: attr:已初始化的線程屬性
detachstate: PTHREAD_CREATE_DETACHED(分離線程)
PTHREAD _CREATE_JOINABLE(非分離線程)
這里要注意的一點是,如果設置一個線程為分離線程,而這個線程運行又非常快,它很可能在pthread_create函數返回之前就終止了,它終止以后就可能將線程號和系統資源移交給其他的線程使用,這樣調用pthread_create的線程就得到了錯誤的線程號。要避免這種情況可以采取一定的同步措施,最簡單的方法之一是可以在被創建的線程里調用pthread_cond_timedwait函數,讓這個線程等待一會兒,留出足夠的時間讓函數pthread_create返回。設置一段等待時間,是在多線程編程里常用的方法。但是注意不要使用諸如wait()之類的函數,它們是使整個進程睡眠,並不能解決線程同步的問題。
線程的棧地址
POSIX.1定義了兩個常量_POSIX_THREAD_ATTR_STACKADDR 和_POSIX_THREAD_ATTR_STACKSIZE檢測系統是否支持棧屬性。也可以給sysconf函數傳遞_SC_THREAD_ATTR_STACKADDR或 _SC_THREAD_ATTR_STACKSIZE來進行檢測。
當進程棧地址空間不夠用時,指定新建線程使用由malloc分配的空間作為自己的棧空間。通過pthread_attr_setstack和pthread_attr_getstack兩個函數分別設置和獲取線程的棧地址。
int pthread_attr_setstack(pthread_attr_t *attr, void *stackaddr, size_t stacksize); 成功:0;失敗:錯誤號
int pthread_attr_getstack(pthread_attr_t *attr, void **stackaddr, size_t *stacksize); 成功:0;失敗:錯誤號
參數: attr:指向一個線程屬性的指針
stackaddr:返回獲取的棧地址
stacksize:返回獲取的棧大小
線程的棧大小
當系統中有很多線程時,可能需要減小每個線程棧的默認大小,防止進程的地址空間不夠用,當線程調用的函數會分配很大的局部變量或者函數調用層次很深時,可能需要增大線程棧的默認大小。
函數pthread_attr_getstacksize和 pthread_attr_setstacksize提供設置。
int pthread_attr_setstacksize(pthread_attr_t *attr, size_t stacksize); 成功:0;失敗:錯誤號
int pthread_attr_getstacksize(pthread_attr_t *attr, size_t *stacksize); 成功:0;失敗:錯誤號
參數: attr:指向一個線程屬性的指針
stacksize:返回線程的堆棧大小
線程屬性控制示例
【pthrd_attr_change.c】
#include <pthread.h> #define SIZE 0x100000 void *th_fun(void *arg) { while (1) sleep(1); } int main(void) { pthread_t tid; int err, detachstate, i = 1; pthread_attr_t attr; size_t stacksize; void *stackaddr; pthread_attr_init(&attr); pthread_attr_getstack(&attr, &stackaddr, &stacksize); pthread_attr_getdetachstate(&attr, &detachstate); if (detachstate == PTHREAD_CREATE_DETACHED) printf("thread detached\n"); else if (detachstate == PTHREAD_CREATE_JOINABLE) printf("thread join\n"); else printf("thread unknown\n"); pthread_attr_setdetachstate(&attr, PTHREAD_CREATE_DETACHED); while (1) { stackaddr = malloc(SIZE); if (stackaddr == NULL) { perror("malloc"); exit(1); } stacksize = SIZE; pthread_attr_setstack(&attr, stackaddr, stacksize); err = pthread_create(&tid, &attr, th_fun, NULL); if (err != 0) { printf("%s\n", strerror(err)); exit(1); } printf("%d\n", i++); } pthread_attr_destroy(&attr); return 0; }
NPTL
1.察看當前pthread庫版本getconf GNU_LIBPTHREAD_VERSION
2.NPTL實現機制(POSIX),Native POSIX Thread Library
3.使用線程庫時gcc指定 –lpthread
線程使用注意事項
- 主線程退出其他線程不退出,主線程應調用pthread_exit
- 避免僵屍線程
pthread_join
pthread_detach
pthread_create指定分離屬性
被join線程可能在join函數返回前就釋放完自己的所有內存資源,所以不應當返回被回收線程棧中的值;
- malloc和mmap申請的內存可以被其他線程釋放
- 應避免在多線程模型中調用fork除非,馬上exec,子進程中只有調用fork的線程存在,其他線程在子進程中均pthread_exit
- 信號的復雜語義很難和多線程共存,應避免在多線程引入信號機制
同步概念
所謂同步,即同時起步,協調一致。不同的對象,對“同步”的理解方式略有不同。如,設備同步,是指在兩個設備之間規定一個共同的時間參考;數據庫同步,是指讓兩個或多個數據庫內容保持一致,或者按需要部分保持一致;文件同步,是指讓兩個或多個文件夾里的文件保持一致。等等
而,編程中、通信中所說的同步與生活中大家印象中的同步概念略有差異。“同”字應是指協同、協助、互相配合。主旨在協同步調,按預定的先后次序運行。
線程同步
同步即協同步調,按預定的先后次序運行。
線程同步,指一個線程發出某一功能調用時,在沒有得到結果之前,該調用不返回。同時其它線程為保證數據一致性,不能調用該功能。
舉例1: 銀行存款 5000。櫃台,折:取3000;提款機,卡:取 3000。剩余:2000
舉例2: 內存中100字節,線程T1欲填入全1, 線程T2欲填入全0。但如果T1執行了50個字節失去cpu,T2執行,會將T1寫過的內容覆蓋。當T1再次獲得cpu繼續 從失去cpu的位置向后寫入1,當執行結束,內存中的100字節,既不是全1,也不是全0。
產生的現象叫做“與時間有關的錯誤”(time related)。為了避免這種數據混亂,線程需要同步。
“同步”的目的,是為了避免數據混亂,解決與時間有關的錯誤。實際上,不僅線程間需要同步,進程間、信號間等等都需要同步機制。
因此,所有“多個控制流,共同操作一個共享資源”的情況,都需要同步。
數據混亂原因:
1. 資源共享(獨享資源則不會)
2. 調度隨機(意味着數據訪問會出現競爭)
3. 線程間缺乏必要的同步機制。
以上3點中,前兩點不能改變,欲提高效率,傳遞數據,資源必須共享。只要共享資源,就一定會出現競爭。只要存在競爭關系,數據就很容易出現混亂。
所以只能從第三點着手解決。使多個線程在訪問共享資源的時候,出現互斥。
互斥量mutex
Linux中提供一把互斥鎖mutex(也稱之為互斥量)。
每個線程在對資源操作前都嘗試先加鎖,成功加鎖才能操作,操作結束解鎖。
資源還是共享的,線程間也還是競爭的,
但通過“鎖”就將資源的訪問變成互斥操作,而后與時間有關的錯誤也不會再產生了。
但,應注意:同一時刻,只能有一個線程持有該鎖。
當A線程對某個全局變量加鎖訪問,B在訪問前嘗試加鎖,拿不到鎖,B阻塞。C線程不去加鎖,而直接訪問該全局變量,依然能夠訪問,但會出現數據混亂。
所以,互斥鎖實質上是操作系統提供的一把“建議鎖”(又稱“協同鎖”),建議程序中有多線程訪問共享資源的時候使用該機制。但,並沒有強制限定。
因此,即使有了mutex,如果有線程不按規則來訪問數據,依然會造成數據混亂。
主要應用函數:
pthread_mutex_init函數
pthread_mutex_destroy函數
pthread_mutex_lock函數
pthread_mutex_trylock函數
pthread_mutex_unlock函數
以上5個函數的返回值都是:成功返回0, 失敗返回錯誤號。
pthread_mutex_t 類型,其本質是一個結構體。為簡化理解,應用時可忽略其實現細節,簡單當成整數看待。
pthread_mutex_t mutex; 變量mutex只有兩種取值1、0。
pthread_mutex_init函數
初始化一個互斥鎖(互斥量) ---> 初值可看作1
int pthread_mutex_init(pthread_mutex_t *restrict mutex, const pthread_mutexattr_t *restrict attr);
參1:傳出參數,調用時應傳 &mutex
restrict關鍵字:只用於限制指針,告訴編譯器,所有修改該指針指向內存中內容的操作,只能通過本指針完成。不能通過除本指針以外的其他變量或指針修改
參2:互斥量屬性。是一個傳入參數,通常傳NULL,選用默認屬性(線程間共享)。 參APUE.12.4同步屬性
- 靜態初始化:如果互斥鎖 mutex 是靜態分配的(定義在全局,或加了static關鍵字修飾),可以直接使用宏進行初始化。e.g. pthead_mutex_t muetx = PTHREAD_MUTEX_INITIALIZER;
- 動態初始化:局部變量應采用動態初始化。e.g. pthread_mutex_init(&mutex, NULL)
pthread_mutex_destroy函數
銷毀一個互斥鎖
int pthread_mutex_destroy(pthread_mutex_t *mutex);
pthread_mutex_lock函數
加鎖。可理解為將mutex--(或-1)
int pthread_mutex_lock(pthread_mutex_t *mutex);
pthread_mutex_unlock函數
解鎖。可理解為將mutex ++(或+1)
int pthread_mutex_unlock(pthread_mutex_t *mutex);
pthread_mutex_trylock函數
嘗試加鎖
int pthread_mutex_trylock(pthread_mutex_t *mutex);
加鎖與解鎖
lock與unlock:
lock嘗試加鎖,如果加鎖不成功,線程阻塞,阻塞到持有該互斥量的其他線程解鎖為止。
unlock主動解鎖函數,同時將阻塞在該鎖上的所有線程全部喚醒,至於哪個線程先被喚醒,取決於優先級、調度。默認:先阻塞、先喚醒。
例如:T1 T2 T3 T4 使用一把mutex鎖。T1加鎖成功,其他線程均阻塞,直至T1解鎖。T1解鎖后,T2 T3 T4均被喚醒,並自動再次嘗試加鎖。
可假想mutex鎖 init成功初值為1。 lock 功能是將mutex--。 unlock將mutex++
lock與trylock:
lock加鎖失敗會阻塞,等待鎖釋放。
trylock加鎖失敗直接返回錯誤號(如:EBUSY),不阻塞。
加鎖步驟測試:
看如下程序:該程序是非常典型的,由於共享、競爭而沒有加任何同步機制,導致產生於時間有關的錯誤,造成數據混亂:
【pthrd_shared.c】
#include <stdio.h> #include <pthread.h> #include <unistd.h> void *tfn(void *arg) { srand(time(NULL)); while (1) { printf("hello "); sleep(rand() % 3); /*模擬長時間操作共享資源,導致cpu易主,產生與時間有關的錯誤*/ printf("world\n"); sleep(rand() % 3); } return NULL; } int main(void) { pthread_t tid; srand(time(NULL)); pthread_create(&tid, NULL, tfn, NULL); while (1) { printf("HELLO "); sleep(rand() % 3); printf("WORLD\n"); sleep(rand() % 3); } pthread_join(tid, NULL); return 0; }
修改該程序,使用mutex互斥鎖進行同步。
- 定義全局互斥量,初始化init(&m, NULL)互斥量,添加對應的destry
- 兩個線程while中,兩次printf前后,分別加lock和unlock
- 將unlock挪至第二個sleep后,發現交替現象很難出現。
線程在操作完共享資源后本應該立即解鎖,但修改后,線程抱着鎖睡眠。睡醒解鎖后又立即加鎖,這兩個庫函數本身不會阻塞。
所以在這兩行代碼之間失去cpu的概率很小。因此,另外一個線程很難得到加鎖的機會。
- main 中加flag = 5 將flg在while中-- 這時,主線程輸出5次后試圖銷毀鎖,但子線程未將鎖釋放,無法完成。
- main 中加pthread_cancel()將子線程取消。 【pthrd_mutex.c】
#include <stdio.h> #include <string.h> #include <pthread.h> #include <stdlib.h> #include <unistd.h> pthread_mutex_t m; void err_thread(int ret, char *str) { if (ret != 0) { fprintf(stderr, "%s:%s\n", str, strerror(ret)); pthread_exit(NULL); } } void *tfn(void *arg) { srand(time(NULL)); while (1) { pthread_mutex_lock(&m); // m-- printf("hello "); sleep(rand() % 3); /*模擬長時間操作共享資源,導致cpu易主,產生與時間有關的錯誤*/ printf("world\n"); pthread_mutex_unlock(&m); // m++ sleep(rand() % 3); } return NULL; } int main(void) { pthread_t tid; srand(time(NULL)); int flag = 5; pthread_mutex_init(&m, NULL); // 1 int ret = pthread_create(&tid, NULL, tfn, NULL); err_thread(ret, "pthread_create error"); while (flag--) { pthread_mutex_lock(&m); // m-- printf("HELLO "); sleep(rand() % 3); printf("WORLD\n"); pthread_mutex_unlock(&m); // m-- sleep(rand() % 3); } pthread_cancel(tid); pthread_join(tid, NULL); pthread_mutex_destroy(&m); return 0; } /*線程之間共享資源stdout*/
結論:
在訪問共享資源前加鎖,訪問結束后立即解鎖。鎖的“粒度”應越小越好。
死鎖
1. 線程試圖對同一個互斥量A加鎖兩次。
2. 線程1擁有A鎖,請求獲得B鎖;線程2擁有B鎖,請求獲得A鎖
讀寫鎖
與互斥量類似,但讀寫鎖允許更高的並行性。其特性為:寫獨占,讀共享。
讀寫鎖狀態:
一把讀寫鎖具備三種狀態:
1. 讀模式下加鎖狀態 (讀鎖)
2. 寫模式下加鎖狀態 (寫鎖)
3. 不加鎖狀態
讀寫鎖特性:
- 讀寫鎖是“寫模式加鎖”時, 解鎖前,所有對該鎖加鎖的線程都會被阻塞。
- 讀寫鎖是“讀模式加鎖”時, 如果線程以讀模式對其加鎖會成功;如果線程以寫模式加鎖會阻塞。
- 讀寫鎖是“讀模式加鎖”時, 既有試圖以寫模式加鎖的線程,也有試圖以讀模式加鎖的線程。那么讀寫鎖會阻塞隨后的讀模式鎖請求。優先滿足寫模式鎖。讀鎖、寫鎖並行阻塞,寫鎖優先級高
讀寫鎖也叫共享-獨占鎖。當讀寫鎖以讀模式鎖住時,它是以共享模式鎖住的;當它以寫模式鎖住時,它是以獨占模式鎖住的。寫獨占、讀共享。
讀寫鎖非常適合於對數據結構讀的次數遠大於寫的情況。
主要應用函數:
pthread_rwlock_init函數
pthread_rwlock_destroy函數
pthread_rwlock_rdlock函數
pthread_rwlock_wrlock函數
pthread_rwlock_tryrdlock函數
pthread_rwlock_trywrlock函數
pthread_rwlock_unlock函數
以上7 個函數的返回值都是:成功返回0, 失敗直接返回錯誤號。
pthread_rwlock_t類型 用於定義一個讀寫鎖變量。
pthread_rwlock_t rwlock;
pthread_rwlock_init函數
初始化一把讀寫鎖
int pthread_rwlock_init(pthread_rwlock_t *restrict rwlock, const pthread_rwlockattr_t *restrict attr);
參2:attr表讀寫鎖屬性,通常使用默認屬性,傳NULL即可。
pthread_rwlock_destroy函數
銷毀一把讀寫鎖
int pthread_rwlock_destroy(pthread_rwlock_t *rwlock);
pthread_rwlock_rdlock函數
以讀方式請求讀寫鎖。(常簡稱為:請求讀鎖)
int pthread_rwlock_rdlock(pthread_rwlock_t *rwlock);
pthread_rwlock_wrlock函數
以寫方式請求讀寫鎖。(常簡稱為:請求寫鎖)
int pthread_rwlock_wrlock(pthread_rwlock_t *rwlock);
pthread_rwlock_unlock函數
解鎖
int pthread_rwlock_unlock(pthread_rwlock_t *rwlock);
pthread_rwlock_tryrdlock函數
非阻塞以讀方式請求讀寫鎖(非阻塞請求讀鎖)
int pthread_rwlock_tryrdlock(pthread_rwlock_t *rwlock);
pthread_rwlock_trywrlock函數
非阻塞以寫方式請求讀寫鎖(非阻塞請求寫鎖)
int pthread_rwlock_trywrlock(pthread_rwlock_t *rwlock);
讀寫鎖示例
看如下示例,同時有多個線程對同一全局數據讀、寫操作。
【rwlock.c】
#include <stdio.h> #include <unistd.h> #include <pthread.h> int counter; pthread_rwlock_t rwlock; /* 3個線程不定時寫同一全局資源,5個線程不定時讀同一全局資源 */ void *th_write(void *arg) { int t, i = (int)arg; while (1) { pthread_rwlock_wrlock(&rwlock); t = counter; usleep(1000); printf("=======write %d: %lu: counter=%d ++counter=%d\n", i, pthread_self(), t, ++counter); pthread_rwlock_unlock(&rwlock); usleep(10000); } return NULL; } void *th_read(void *arg) { int i = (int)arg; while (1) { pthread_rwlock_rdlock(&rwlock); printf("----------------------------read %d: %lu: %d\n", i, pthread_self(), counter); pthread_rwlock_unlock(&rwlock); usleep(2000); } return NULL; } int main(void) { int i; pthread_t tid[8]; pthread_rwlock_init(&rwlock, NULL); for (i = 0; i < 3; i++) pthread_create(&tid[i], NULL, th_write, (void *)i); for (i = 0; i < 5; i++) pthread_create(&tid[i+3], NULL, th_read, (void *)i); for (i = 0; i < 8; i++) pthread_join(tid[i], NULL); pthread_rwlock_destroy(&rwlock); return 0; }
#include <stdio.h> #include <unistd.h> #include <pthread.h> int counter; pthread_rwlock_t rwlock; /* 3個線程不定時寫同一全局資源,5個線程不定時讀同一全局資源 */ void *th_write(void *arg) { int t; int i = (int)arg; while (1) { pthread_rwlock_wrlock(&rwlock); t = counter; usleep(1000); printf("=======write %d: %lu: counter=%d ++counter=%d\n", i, pthread_self(), t, ++counter); pthread_rwlock_unlock(&rwlock); usleep(10000); } return NULL; } void *th_read(void *arg) { int i = (int)arg; while (1) { pthread_rwlock_rdlock(&rwlock); printf("----------------------------read %d: %lu: %d\n", i, pthread_self(), counter); pthread_rwlock_unlock(&rwlock); usleep(2000); } return NULL; } int main(void) { int i; pthread_t tid[8]; pthread_rwlock_init(&rwlock, NULL); for (i = 0; i < 3; i++) pthread_create(&tid[i], NULL, th_write, (void *)i); for (i = 0; i < 5; i++) pthread_create(&tid[i+3], NULL, th_read, (void *)i); for (i = 0; i < 8; i++) pthread_join(tid[i], NULL); pthread_rwlock_destroy(&rwlock); return 0; }
條件變量:
條件本身不是鎖!但它也可以造成線程阻塞。通常與互斥鎖配合使用。給多線程提供一個會合的場所。
主要應用函數:
pthread_cond_init函數
pthread_cond_destroy函數
pthread_cond_wait函數
pthread_cond_timedwait函數
pthread_cond_signal函數
pthread_cond_broadcast函數
以上6 個函數的返回值都是:成功返回0, 失敗直接返回錯誤號。
pthread_cond_t類型 用於定義條件變量
pthread_cond_t cond;
pthread_cond_init函數
初始化一個條件變量
int pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);
參2:attr表條件變量屬性,通常為默認值,傳NULL即可
也可以使用靜態初始化的方法,初始化條件變量:
pthread_cond_t cond = PTHREAD_COND_INITIALIZER;
pthread_cond_destroy函數
銷毀一個條件變量
int pthread_cond_destroy(pthread_cond_t *cond);
pthread_cond_wait函數
阻塞等待一個條件變量
int pthread_cond_wait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex);
函數作用:
- 阻塞等待條件變量cond(參1)滿足
- 釋放已掌握的互斥鎖(解鎖互斥量)相當於pthread_mutex_unlock(&mutex);
1.2.兩步為一個原子操作。
- 當被喚醒,pthread_cond_wait函數返回時,解除阻塞並重新申請獲取互斥鎖pthread_mutex_lock(&mutex);
pthread_cond_timedwait函數
限時等待一個條件變量
int pthread_cond_timedwait(pthread_cond_t *restrict cond, pthread_mutex_t *restrict mutex, const struct timespec *restrict abstime);
參3:
struct timespec {
time_t tv_sec; /* seconds */ 秒
long tv_nsec; /* nanosecondes*/ 納秒
}
形參abstime:絕對時間。
如:time(NULL)返回的就是絕對時間。而alarm(1)是相對時間,相對當前時間定時1秒鍾。
struct timespec t = {1, 0};
sem_timedwait(&sem, &t); 這樣只能定時到 1970年1月1日 00:00:01秒(早已經過去)
正確用法:
time_t cur = time(NULL); 獲取當前時間。
struct timespec t; 定義timespec 結構體變量t
t.tv_sec = cur+1; 定時1秒
pthread_cond_timedwait (&cond, &t); 傳參 參APUE.11.6線程同步條件變量小節
在講解setitimer函數時我們還提到另外一種時間類型:
struct timeval {
time_t tv_sec; /* seconds */ 秒
suseconds_t tv_usec; /* microseconds */ 微秒
};
pthread_cond_signal函數
喚醒至少一個阻塞在條件變量上的線程
int pthread_cond_signal(pthread_cond_t *cond);
pthread_cond_broadcast函數
喚醒全部阻塞在條件變量上的線程
int pthread_cond_broadcast(pthread_cond_t *cond);
生產者消費者條件變量模型
線程同步典型的案例即為生產者消費者模型,而借助條件變量來實現這一模型,是比較常見的一種方法。假定有兩個線程,一個模擬生產者行為,一個模擬消費者行為。兩個線程同時操作一個共享資源(一般稱之為匯聚),生產向其中添加產品,消費者從中消費掉產品。
看如下示例,使用條件變量模擬生產者、消費者問題:
【conditionVar_product_consumer.c】
#include <stdlib.h> #include <unistd.h> #include <pthread.h> struct msg { struct msg *next; int num; }; struct msg *head; pthread_cond_t has_product = PTHREAD_COND_INITIALIZER; pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER; void *consumer(void *p) { struct msg *mp; for (;;) { pthread_mutex_lock(&lock); while (head == NULL) { //頭指針為空,說明沒有節點 可以為if嗎 pthread_cond_wait(&has_product, &lock); } mp = head; head = mp->next; //模擬消費掉一個產品 pthread_mutex_unlock(&lock); printf("-Consume ---%d\n", mp->num); free(mp); sleep(rand() % 5); } } void *producer(void *p) { struct msg *mp; while (1) { mp = malloc(sizeof(struct msg)); mp->num = rand() % 1000 + 1; //模擬生產一個產品 printf("-Produce ---%d\n", mp->num); pthread_mutex_lock(&lock); mp->next = head; head = mp; pthread_mutex_unlock(&lock); pthread_cond_signal(&has_product); //將等待在該條件變量上的一個線程喚醒 sleep(rand() % 5); } } int main(int argc, char *argv[]) { pthread_t pid, cid; srand(time(NULL)); pthread_create(&pid, NULL, producer, NULL); pthread_create(&cid, NULL, consumer, NULL); pthread_join(pid, NULL); pthread_join(cid, NULL); return 0; }
/*借助條件變量模擬 生產者-消費者 問題*/ #include <stdlib.h> #include <unistd.h> #include <pthread.h> #include <stdio.h> /*鏈表作為公享數據,需被互斥量保護*/ struct msg { struct msg *next; int num; }; struct msg *head; /* 靜態初始化 一個條件變量 和 一個互斥量*/ pthread_cond_t has_product = PTHREAD_COND_INITIALIZER; pthread_mutex_t lock = PTHREAD_MUTEX_INITIALIZER; void *consumer(void *p) { struct msg *mp; for (;;) { pthread_mutex_lock(&lock); while (head == NULL) { //頭指針為空,說明沒有節點 可以為if嗎 pthread_cond_wait(&has_product, &lock); } mp = head; head = mp->next; //模擬消費掉一個產品 pthread_mutex_unlock(&lock); printf("-Consume %lu---%d\n", pthread_self(), mp->num); free(mp); sleep(rand() % 4); } } void *producer(void *p) { struct msg *mp; for (;;) { mp = malloc(sizeof(struct msg)); mp->num = rand() % 1000 + 1; //模擬生產一個產品 printf("-Produce -------------%d\n", mp->num); pthread_mutex_lock(&lock); mp->next = head; head = mp; pthread_mutex_unlock(&lock); pthread_cond_signal(&has_product); //將等待在該條件變量上的一個線程喚醒 sleep(rand() % 4); } } int main(int argc, char *argv[]) { pthread_t pid, cid; srand(time(NULL)); pthread_create(&pid, NULL, producer, NULL); pthread_create(&cid, NULL, consumer, NULL); pthread_create(&cid, NULL, consumer, NULL); pthread_create(&cid, NULL, consumer, NULL); pthread_create(&cid, NULL, consumer, NULL); pthread_join(pid, NULL); pthread_join(cid, NULL); return 0; }
條件變量的優點:
相較於mutex而言,條件變量可以減少競爭。
如直接使用mutex,除了生產者、消費者之間要競爭互斥量以外,消費者之間也需要競爭互斥量,但如果匯聚(鏈表)中沒有數據,消費者之間競爭互斥鎖是無意義的。有了條件變量機制以后,只有生產者完成生產,才會引起消費者之間的競爭。提高了程序效率。
信號量
進化版的互斥鎖(1 --> N)
由於互斥鎖的粒度比較大,如果我們希望在多個線程間對某一對象的部分數據進行共享,使用互斥鎖是沒有辦法實現的,只能將整個數據對象鎖住。這樣雖然達到了多線程操作共享數據時保證數據正確性的目的,卻無形中導致線程的並發性下降。線程從並行執行,變成了串行執行。與直接使用單進程無異。
信號量,是相對折中的一種處理方式,既能保證同步,數據不混亂,又能提高線程並發。
主要應用函數:
sem_init函數
sem_destroy函數
sem_wait函數
sem_trywait函數
sem_timedwait函數
sem_post函數
以上6 個函數的返回值都是:成功返回0, 失敗返回-1,同時設置errno。(注意,它們沒有pthread前綴)
sem_t類型,本質仍是結構體。但應用期間可簡單看作為整數,忽略實現細節(類似於使用文件描述符)。
sem_t sem; 規定信號量sem不能 < 0。頭文件 <semaphore.h>
信號量基本操作:
sem_wait: 1. 信號量大於0,則信號量-- (類比pthread_mutex_lock)
| 2. 信號量等於0,造成線程阻塞
對應
|
sem_post: 將信號量++,同時喚醒阻塞在信號量上的線程 (類比pthread_mutex_unlock)
但,由於sem_t的實現對用戶隱藏,所以所謂的++、--操作只能通過函數來實現,而不能直接++、--符號。
信號量的初值,決定了占用信號量的線程的個數。
sem_init函數
初始化一個信號量
int sem_init(sem_t *sem, int pshared, unsigned int value);
參1:sem信號量
參2:pshared取0用於線程間;取非0用於進程間
參3:value指定信號量初值
sem_destroy函數
銷毀一個信號量
int sem_destroy(sem_t *sem);
sem_wait函數
給信號量加鎖 --
int sem_wait(sem_t *sem);
sem_post函數
給信號量解鎖 ++
int sem_post(sem_t *sem);
sem_trywait函數
嘗試對信號量加鎖 -- (與sem_wait的區別類比lock和trylock)
int sem_trywait(sem_t *sem);
sem_timedwait函數
限時嘗試對信號量加鎖 --
int sem_timedwait(sem_t *sem, const struct timespec *abs_timeout);
參2:abs_timeout采用的是絕對時間。
定時1秒:
time_t cur = time(NULL); 獲取當前時間。
struct timespec t; 定義timespec 結構體變量t
t.tv_sec = cur+1; 定時1秒
sem_timedwait(&sem, &t); 傳參
生產者消費者信號量模型
【例】:使用信號量完成線程間同步,模擬生產者,消費者問題。
【sem_product_consumer.c】
/*信號量實現 生產者 消費者問題*/ #include <stdlib.h> #include <unistd.h> #include <pthread.h> #include <stdio.h> #include <semaphore.h> #define NUM 5 int queue[NUM]; //全局數組實現環形隊列 sem_t blank_number, product_number; //空格子信號量, 產品信號量 void *producer(void *arg) { int i = 0; while (1) { sem_wait(&blank_number); //生產者將空格子數--,為0則阻塞等待 queue[i] = rand() % 1000 + 1; //生產一個產品 printf("----Produce---%d\n", queue[i]); sem_post(&product_number); //將產品數++ i = (i+1) % NUM; //借助下標實現環形 sleep(rand()%1); } } void *consumer(void *arg) { int i = 0; while (1) { sem_wait(&product_number); //消費者將產品數--,為0則阻塞等待 printf("-Consume---%d %lu\n", queue[i], pthread_self()); queue[i] = 0; //消費一個產品 sem_post(&blank_number); //消費掉以后,將空格子數++ i = (i+1) % NUM; sleep(rand()%1); } } int main(int argc, char *argv[]) { pthread_t pid, cid; sem_init(&blank_number, 0, NUM); //初始化空格子信號量為5 sem_init(&product_number, 0, 0); //產品數為0 pthread_create(&pid, NULL, producer, NULL); pthread_create(&cid, NULL, consumer, NULL); pthread_create(&cid, NULL, consumer, NULL); pthread_join(pid, NULL); pthread_join(cid, NULL); sem_destroy(&blank_number); sem_destroy(&product_number); return 0; }
分析:
規定: 如果□中有數據,生產者不能生產,只能阻塞。
如果□中沒有數據,消費者不能消費,只能等待數據。
定義兩個信號量:S滿 = 0, S空 = 1 (S滿代表滿格的信號量,S空表示空格的信號量,程序起始,格子一定為空)
所以有: T生產者主函數 { T消費者主函數 {
sem_wait(S空); sem_wait(S滿);
生產.... 消費....
sem_post(S滿); sem_post(S空);
} }
假設: 線程到達的順序是:T生、T生、T消。
那么: T生1 到達,將S空-1,生產,將S滿+1
T生2 到達,S空已經為0, 阻塞
T消 到達,將S滿-1,消費,將S空+1
三個線程到達的順序是:T生1、T生2、T消。而執行的順序是T生1、T消、T生2
這里,S空 表示空格子的總數,代表可占用信號量的線程總數-->1。其實這樣的話,信號量就等同於互斥鎖。
但,如果S空=2、3、4……就不一樣了,該信號量同時可以由多個線程占用,不再是互斥的形式。因此我們說信號量是互斥鎖的加強版。
理解上述模型,推演,如果是兩個消費者,一個生產者,是怎么樣的情況。
【例】:結合生產者消費者信號量模型,揣摩sem_timedwait函數作用。編程實現,一個線程讀用戶輸入, 另一個線程打印“hello world”。如果用戶無輸入,則每隔5秒向屏幕打印一個“hello world”;如果用戶有輸入,立刻打印“hello world”到屏幕。
進程間同步
互斥量mutex
進程間也可以使用互斥鎖,來達到同步的目的。但應在pthread_mutex_init初始化之前,修改其屬性為進程間共享。mutex的屬性修改函數主要有以下幾個。
主要應用函數:
pthread_mutexattr_t mattr 類型: 用於定義mutex鎖的【屬性】
pthread_mutexattr_init函數: 初始化一個mutex屬性對象
int pthread_mutexattr_init(pthread_mutexattr_t *attr);
pthread_mutexattr_destroy函數: 銷毀mutex屬性對象 (而非銷毀鎖)
int pthread_mutexattr_destroy(pthread_mutexattr_t *attr);
pthread_mutexattr_setpshared函數: 修改mutex屬性。
int pthread_mutexattr_setpshared(pthread_mutexattr_t *attr, int pshared);
參2:pshared取值:
線程鎖:PTHREAD_PROCESS_PRIVATE (mutex的默認屬性即為線程鎖,進程間私有)
進程鎖:PTHREAD_PROCESS_SHARED
進程間mutex示例
進程間使用mutex來實現同步:
#include <fcntl.h>
#include <pthread.h>
#include <sys/mman.h>
#include <sys/wait.h>
struct mt {
int num;
pthread_mutex_t mutex;
pthread_mutexattr_t mutexattr;
};
int main(void)
{
int fd, i;
struct mt *mm;
pid_t pid;
fd = open("mt_test", O_CREAT | O_RDWR, 0777);
ftruncate(fd, sizeof(*mm));
mm = mmap(NULL, sizeof(*mm), PROT_READ|PROT_WRITE, MAP_SHARED, fd, 0);
close(fd);
unlink("mt_test");
//mm = mmap(NULL, sizeof(*mm), PROT_READ|PROT_WRITE, MAP_SHARED|MAP_ANON, -1, 0);
memset(mm, 0, sizeof(*mm));
pthread_mutexattr_init(&mm->mutexattr); //初始化mutex屬性對象
pthread_mutexattr_setpshared(&mm->mutexattr, PTHREAD_PROCESS_SHARED); //修改屬性為進程間共享
pthread_mutex_init(&mm->mutex, &mm->mutexattr); //初始化一把mutex瑣
pid = fork();
if (pid == 0) {
for (i = 0; i < 10; i++) {
pthread_mutex_lock(&mm->mutex);
(mm->num)++;
printf("-child----num++ %d\n", mm->num);
pthread_mutex_unlock(&mm->mutex);
sleep(1);
}
} else if (pid > 0) {
for ( i = 0; i < 10; i++) {
sleep(1);
pthread_mutex_lock(&mm->mutex);
mm->num += 2;
printf("-parent---num+=2 %d\n", mm->num);
pthread_mutex_unlock(&mm->mutex);
}
wait(NULL);
}
pthread_mutexattr_destroy(&mm->mutexattr); //銷毀mutex屬性對象
pthread_mutex_destroy(&mm->mutex); //銷毀mutex
munmap(mm,sizeof(*mm)); //釋放映射區
return 0;
} 【process_mutex.c】
文件鎖
借助 fcntl函數來實現鎖機制。 操作文件的進程沒有獲得鎖時,可以打開,但無法執行read、write操作。
fcntl函數: 獲取、設置文件訪問控制屬性。
int fcntl(int fd, int cmd, ... /* arg */ );
參2:
F_SETLK (struct flock *) 設置文件鎖(trylock)
F_SETLKW (struct flock *) 設置文件鎖(lock)W --> wait
F_GETLK (struct flock *) 獲取文件鎖
參3:
struct flock {
...
short l_type; 鎖的類型:F_RDLCK 、F_WRLCK 、F_UNLCK
short l_whence; 偏移位置:SEEK_SET、SEEK_CUR、SEEK_END
off_t l_start; 起始偏移:
off_t l_len; 長度:0表示整個文件加鎖
pid_t l_pid; 持有該鎖的進程ID:(F_GETLK only)
...
};
進程間文件鎖示例
多個進程對加鎖文件進行訪問:
#include <stdio.h>
#include <fcntl.h>
#include <unistd.h>
void sys_err(char *str)
{
perror(str); exit(1);
}
int main(int argc, char *argv[])
{
int fd;
struct flock f_lock;
if (argc < 2) {
printf("./a.out filename\n"); exit(1);
}
if ((fd = open(argv[1], O_RDWR)) < 0)
sys_err("open");
//f_lock.l_type = F_WRLCK; /*選用寫瑣*/
f_lock.l_type = F_RDLCK; /*選用讀瑣*/
f_lock.l_whence = SEEK_SET;
f_lock.l_start = 0;
f_lock.l_len = 0; /* 0表示整個文件加鎖 */
fcntl(fd, F_SETLKW, &f_lock);
printf("get flock\n");
sleep(10);
f_lock.l_type = F_UNLCK;
fcntl(fd, F_SETLKW, &f_lock);
printf("un flock\n");
close(fd); return 0;
} 【file_lock.c】
依然遵循“讀共享、寫獨占”特性。但!如若進程不加鎖直接操作文件,依然可訪問成功,但數據勢必會出現混亂。
【思考】:多線程中,可以使用文件鎖嗎?
多線程間共享文件描述符,而給文件加鎖,是通過修改文件描述符所指向的文件結構體中的成員變量來實現的。因此,多線程中無法使用文件鎖。
哲學家用餐模型分析
多線程版:
選用互斥鎖mutex,如創建5個, pthread_mutex_t m[5];
模型抽象:
5個哲學家 --> 5個線程; 5支筷子 --> 5把互斥鎖 int left(左手), right(右手)
5個哲學家使用相同的邏輯,可通用一個線程主函數,void *tfn(void *arg),使用參數來表示線程編號:int i = (int)arg;
哲學家線程根據編號知道自己是第幾個哲學家,而后選定鎖,鎖住,吃飯。否則哲學家thinking。
A B C D E
5支筷子,在邏輯上形成環: 0 1 2 3 4 分別對應5個哲學家:
所以有:
if(i == 4)
left = i, right = 0;
else
left = i, right = i+1;
振盪:如果每個人都攥着自己左手的鎖,嘗試去拿右手鎖,拿不到則將鎖釋放。過會兒五個人又同時再攥着左手鎖嘗試拿右手鎖,依然拿不到。如此往復形成另外一種極端死鎖的現象——振盪。
避免振盪現象:只需5個人中,任意一個人,拿鎖的方向與其他人相逆即可(如:E,原來:左:4,右:0 現在:左:0, 右:4)。
所以以上if else語句應改為:
if(i == 4)
left = 0, right = i;
else
left = i, right = i+1;
而后, 首先應讓哲學家嘗試加左手鎖:
while {
pthread_mutex_lock(&m[left]); 如果加鎖成功,函數返回再加右手鎖,
如果失敗,應立即釋放左手鎖,等待。
若,左右手都加鎖成功 --> 吃 --> 吃完 --> 釋放鎖(應先釋放右手、再釋放左手,是加鎖順序的逆序)
}
主線程(main)中,初始化5把鎖,銷毀5把鎖,創建5個線程(並將i傳遞給線程主函數),回收5個線程。
避免死鎖的方法:
1. 當得不到所有所需資源時,放棄已經獲得的資源,等待。
2. 保證資源的獲取順序,要求每個線程獲取資源的順序一致。如:A獲取順序1、2、3;B順序應也是1、2、3。若B為3、2、1則易出現死鎖現象。
多進程版
相較於多線程需注意問題:
需注意如何共享信號量 (注意:堅決不能使用全局變量 sem_t s[5])
實現:
main函數中:
循環 sem_init(&s[i], 0, 1); 將信號量初值設為1,信號量變為互斥鎖。
循環 sem_destroy(&s[i]);
循環 創建 5 個子進程。 if(i < 5) 中完成子進程的代碼邏輯。
循環 回收 5 個子進程。
子進程中:
if(i == 4)
left = 0, right == 4;
else
left = i, right = i+1;
while (1) {
使用 sem_wait(&s[left]) 鎖左手,嘗試鎖右手,若成功 --> 吃; 若不成功 --> 將左手鎖釋放。
吃完后, 先釋放右手鎖,再釋放左手鎖。
}
【重點注意】:
直接將sem_t s[5]放在全局位置,試圖用於子進程間共享是錯誤的!應將其定義放置與mmap共享映射區中。main中:
sem_t *s = mmap(NULL, sizeof(sem_t) * 5, PROT_READ|PROT_WRITE, MAP_SHARED|MAP_ANON, -1, 0);
使用方式:將s當成數組首地址看待,與使用數組s[5]沒有差異。