4. read/write read函數從打開的設備或文件中讀取數據。 #include <unistd.h> ssize_t read(int fd, void *buf, size_t count); 返回值:成功返回讀取的字節數,出錯返回-1並設置errno,如果在調read之前已到達文件末尾,則這次read返回0 參數count是請求讀取的字節數,讀上來的數據保存在緩沖區buf中,同時文件的當前讀寫位置向后移。注意這個讀寫位置和使用C標准I/O庫時的讀寫位置有可能不同,這個讀寫位置是記在內核中的,而使用C標准I/O庫時的讀寫位置是用戶空間I/O緩沖區中的位置。 fread就是通過read來實現的,fread是C語言的庫,而read是系統調用 但是差別在read每次讀的數據是調用者要求的大小,比如調用要求讀取10個字節數據,read就會讀10個字節數據到數組中,而fread不一樣,為了加快讀的速度,fread每次都會讀比要求更多的數據,然后放到緩沖區中,這樣下次再讀數據只需要到緩沖區中去取就可以了。 fread每次會讀取一個緩沖區大小的數據,32位下一般是4096個字節,相當於調用了read(fd,buf,4096) 比如需要讀取512個字節數據,分4次讀取,調用read就是: for(i=0; i<4; ++i) read(fd,buf,128) 一共有4次系統調用 而fread一次就讀取了4096字節放到緩沖區了,所以省事了 比如用fgetc讀一個字節,fgetc有可能從內核中預讀1024個字節到I/O緩沖區中,再返回第一個字節,這時該文件在內核中記錄的讀寫位置是1024,而在FILE結構體中記錄的讀寫位置是1。注意返回值類型是ssize_t,表示有符號的size_t,這樣既可以返回正的字節數、0(表示到達文件末尾)也可以返回負值-1(表示出錯)。read函數返回時,返回值說明了buf中前多少個字節是剛讀上來的。有些情況下,實際讀到的字節數(返回值)會小於請求讀的字節數count,例如: 讀常規文件時,在讀到count個字節之前已到達文件末尾。例如,距文件末尾還有30個字節而請求讀100個字節,則read返回30,下次read將返回0。 從終端設備讀,通常以行為單位,讀到換行符就返回了。 從網絡讀,根據不同的傳輸層協議和內核緩存機制,返回值可能小於請求的字節數,后面socket編程部分會詳細講解。 write函數向打開的設備或文件中寫數據。 #include <unistd.h> ssize_t write(int fd, const void *buf, size_t count); 返回值:成功返回寫入的字節數,出錯返回-1並設置errno 寫常規文件時,write的返回值通常等於請求寫的字節數count,而向終端設備或網絡寫則不一定。 讀常規文件是不會阻塞的,不管讀多少字節,read一定會在有限的時間內返回。從終端設備或網絡讀則不一定,如果從終端輸入的數據沒有換行符,調用read讀終端設備就會阻塞,如果網絡上沒有接收到數據包,調用read從網絡讀就會阻塞,至於會阻塞多長時間也是不確定的,如果一直沒有數據到達就一直阻塞在那里。同樣,寫常規文件是不會阻塞的,而向終端設備或網絡寫則不一定。 現在明確一下阻塞(Block)這個概念。當進程調用一個阻塞的系統函數時,該進程被置於睡眠(Sleep)狀態,這時內核調度其它進程運行,直到該進程等待的事件發生了(比如網絡上接收到數據包,或者調用sleep指定的睡眠時間到了)它才有可能繼續運行。與睡眠狀態相對的是運行(Running)狀態,在Linux內核中,處於運行狀態的進程分為兩種情況: 正在被調度執行。CPU處於該進程的上下文環境中,程序計數器(eip)里保存着該進程的指令地址,通用寄存器里保存着該進程運算過程的中間結果,正在執行該進程的指令,正在讀寫該進程的地址空間。 就緒狀態。該進程不需要等待什么事件發生,隨時都可以執行,但CPU暫時還在執行另一個進程,所以該進程在一個就緒隊列中等待被內核調度。系統中可能同時有多個就緒的進程,那么該調度誰執行呢?內核的調度算法是基於優先級和時間片的,而且會根據每個進程的運行情況動態調整它的優先級和時間片,讓每個進程都能比較公平地得到機會執行,同時要兼顧用戶體驗,不能讓和用戶交互的進程響應太慢。 下面這個小程序從終端讀數據再寫回終端。 例 28.2. 阻塞讀終端 #include <unistd.h> #include <stdlib.h> int main(void) { char buf[10]; int n; n = read(STDIN_FILENO, buf, 10); if (n < 0) { perror("read STDIN_FILENO"); exit(1); } write(STDOUT_FILENO, buf, n); return 0; } 執行結果如下: $ ./a.out hello(回車) hello $ ./a.out hello world(回車) hello worl$ d bash: d: command not found 第一次執行a.out的結果很正常,而第二次執行的過程有點特殊,現在分析一下: Shell進程創建a.out進程,a.out進程開始執行,而Shell進程睡眠等待a.out進程退出。 a.out調用read時睡眠等待,直到終端設備輸入了換行符才從read返回,read只讀走10個字符,剩下的字符仍然保存在內核的終端設備輸入緩沖區中。 a.out進程打印並退出,這時Shell進程恢復運行,Shell繼續從終端讀取用戶輸入的命令,於是讀走了終端設備輸入緩沖區中剩下的字符d和換行符,把它當成一條命令解釋執行,結果發現執行不了,沒有d這個命令。
#include <unistd.h> #include <stdlib.h> #include <unistd.h> #include <fcntl.h> int main(void) { char buf[10]; int n; fcntl(STDIN_FILENO,F_SETFL,O_NONBLOCK); n = read(STDIN_FILENO, buf, 10); if (n < 0) { perror("read STDIN_FILENO"); exit(1); } write(STDOUT_FILENO, buf, n); return 0; }
上面的意思是輸入終端資源暫時不可用
如果把 fcntl(STDIN_FILENO,F_SETFL,O_NONBLOCK);這句注釋掉

一直阻塞直到有數據輸入
如果在open一個設備時指定了O_NONBLOCK標志,read/write就不會阻塞。以read為例,如果設備暫時沒有數據可讀就返回-1,同時置errno為EWOULDBLOCK(或者EAGAIN,這兩個宏定義的值相同),表示本來應該阻塞在這里(would block,虛擬語氣),事實上並沒有阻塞而是直接返回錯誤,調用者應該試着再讀一次(again)。這種行為方式稱為輪詢(Poll),調用者只是查詢一下,而不是阻塞在這里死等,這樣可以同時監視多個設備: while(1) { 非阻塞read(設備1); if(設備1有數據到達) 處理數據; 非阻塞read(設備2); if(設備2有數據到達) 處理數據; ... } 如果read(設備1)是阻塞的,那么只要設備1沒有數據到達就會一直阻塞在設備1的read調用上,即使設備2有數據到達也不能處理,使用非阻塞I/O就可以避免設備2得不到及時處理。 非阻塞I/O有一個缺點,如果所有設備都一直沒有數據到達,調用者需要反復查詢做無用功,如果阻塞在那里,操作系統可以調度別的進程執行,就不會做無用功了。在使用非阻塞I/O時,通常不會在一個while循環中一直不停地查詢(這稱為Tight Loop),而是每延遲等待一會兒來查詢一下,以免做太多無用功,在延遲等待的時候可以調度其它進程執行。 while(1) { 非阻塞read(設備1); if(設備1有數據到達) 處理數據; 非阻塞read(設備2); if(設備2有數據到達) 處理數據; ... sleep(n); } 這樣做的問題是,設備1有數據到達時可能不能及時處理,最長需延遲n秒才能處理,而且反復查詢還是做了很多無用功。以后要學習的select(2)函數可以阻塞地同時監視多個設備,還可以設定阻塞等待的超時時間,從而圓滿地解決了這個問題。 以下是一個非阻塞I/O的例子。目前我們學過的可能引起阻塞的設備只有終端,所以我們用終端來做這個實驗。程序開始執行時在0、1、2文件描述符上自動打開的文件就是終端,但是沒有O_NONBLOCK標志。所以就像例 28.2 “阻塞讀終端”一樣,讀標准輸入是阻塞的。我們可以重新打開一遍設備文件/dev/tty(表示當前終端),在打開時指定O_NONBLOCK標志。 O_NONBLOCK 以不可阻斷的方式打開文件,也就是無論有無數據讀取或等待,都會立即返回進程之中。 例 28.3. 非阻塞讀終端 從終端設備或網絡讀則不一定,如果從終端輸入的數據沒有換行符,調用read讀終端設備就會阻塞 #include <unistd.h> #include <fcntl.h> #include <errno.h> #include <string.h> #include <stdlib.h> #define MSG_TRY "try again\n" int main(void) { char buf[10]; int fd, n; fd = open("/dev/tty", O_RDONLY|O_NONBLOCK); if(fd<0) { perror("open /dev/tty"); exit(1); } tryagain: n = read(fd, buf, 10); if (n < 0) { if (errno == EAGAIN) { sleep(1); write(STDOUT_FILENO, MSG_TRY, strlen(MSG_TRY)); goto tryagain; } perror("read /dev/tty"); exit(1); } write(STDOUT_FILENO, buf, n); close(fd); return 0; } 直到按下回車把之前的輸入輸出(最多10個),然后停止。 以下是用非阻塞I/O實現等待超時的例子。既保證了超時退出的邏輯又保證了有數據到達時處理延遲較小。 例 28.4. 非阻塞讀終端和等待超時 read:既可以返回正的字節數、0(表示到達文件末尾)也可以返回負值-1(表示出錯) #include <unistd.h> #include <fcntl.h> #include <errno.h> #include <string.h> #include <stdlib.h> #define MSG_TRY "try again\n" #define MSG_TIMEOUT "timeout\n" int main(void) { char buf[10]; int fd, n, i; fd = open("/dev/tty", O_RDONLY|O_NONBLOCK); if(fd<0) { perror("open /dev/tty"); exit(1); } for(i=0; i<5; i++) { n = read(fd, buf, 10); if(n>=0) break; if(errno!=EAGAIN) { perror("read /dev/tty"); exit(1); } sleep(1); write(STDOUT_FILENO, MSG_TRY, strlen(MSG_TRY)); } if(i==5) write(STDOUT_FILENO, MSG_TIMEOUT, strlen(MSG_TIMEOUT)); else write(STDOUT_FILENO, buf, n); close(fd); return 0; }
轉載自:http://blog.163.com/bowen_tong/blog/static/20681717420126601118551/