Linux系統編程--read/write

本文轉載自查看原文 2015-05-05 14:25 16010 linux

4. read/write 

read函數從打開的設備或文件中讀取數據。
#include <unistd.h>  ssize_t read(int fd, void *buf, size_t count); 返回值：成功返回讀取的字節數，出錯返回-1並設置errno，如果在調read之前已到達文件末尾，則這次read返回0
參數count是請求讀取的字節數，讀上來的數據保存在緩沖區buf中，同時文件的當前讀寫位置向后移。注意這個讀寫位置和使用C標准I/O庫時的讀寫位置有可能不同，這個讀寫位置是記在內核中的，而使用C標准I/O庫時的讀寫位置是用戶空間I/O緩沖區中的位置。

fread就是通過read來實現的，fread是C語言的庫，而read是系統調用
但是差別在read每次讀的數據是調用者要求的大小，比如調用要求讀取10個字節數據，read就會讀10個字節數據到數組中，而fread不一樣，為了加快讀的速度，fread每次都會讀比要求更多的數據，然后放到緩沖區中，這樣下次再讀數據只需要到緩沖區中去取就可以了。

fread每次會讀取一個緩沖區大小的數據，32位下一般是4096個字節，相當於調用了read(fd,buf,4096)

比如需要讀取512個字節數據，分4次讀取，調用read就是：
for(i=0; i<4; ++i)
read(fd,buf,128)
一共有4次系統調用

而fread一次就讀取了4096字節放到緩沖區了，所以省事了


比如用fgetc讀一個字節，fgetc有可能從內核中預讀1024個字節到I/O緩沖區中，再返回第一個字節，這時該文件在內核中記錄的讀寫位置是1024，而在FILE結構體中記錄的讀寫位置是1。注意返回值類型是ssize_t，表示有符號的size_t，這樣既可以返回正的字節數、0（表示到達文件末尾）也可以返回負值-1（表示出錯）。read函數返回時，返回值說明了buf中前多少個字節是剛讀上來的。有些情況下，實際讀到的字節數（返回值）會小於請求讀的字節數count，例如：
讀常規文件時，在讀到count個字節之前已到達文件末尾。例如，距文件末尾還有30個字節而請求讀100個字節，則read返回30，下次read將返回0。

從終端設備讀，通常以行為單位，讀到換行符就返回了。

從網絡讀，根據不同的傳輸層協議和內核緩存機制，返回值可能小於請求的字節數，后面socket編程部分會詳細講解。

write函數向打開的設備或文件中寫數據。
#include <unistd.h>  ssize_t write(int fd, const void *buf, size_t count); 返回值：成功返回寫入的字節數，出錯返回-1並設置errno
寫常規文件時，write的返回值通常等於請求寫的字節數count，而向終端設備或網絡寫則不一定。
讀常規文件是不會阻塞的，不管讀多少字節，read一定會在有限的時間內返回。從終端設備或網絡讀則不一定，如果從終端輸入的數據沒有換行符，調用read讀終端設備就會阻塞，如果網絡上沒有接收到數據包，調用read從網絡讀就會阻塞，至於會阻塞多長時間也是不確定的，如果一直沒有數據到達就一直阻塞在那里。同樣，寫常規文件是不會阻塞的，而向終端設備或網絡寫則不一定。



現在明確一下阻塞（Block）這個概念。當進程調用一個阻塞的系統函數時，該進程被置於睡眠（Sleep）狀態，這時內核調度其它進程運行，直到該進程等待的事件發生了（比如網絡上接收到數據包，或者調用sleep指定的睡眠時間到了）它才有可能繼續運行。與睡眠狀態相對的是運行（Running）狀態，在Linux內核中，處於運行狀態的進程分為兩種情況：
正在被調度執行。CPU處於該進程的上下文環境中，程序計數器（eip）里保存着該進程的指令地址，通用寄存器里保存着該進程運算過程的中間結果，正在執行該進程的指令，正在讀寫該進程的地址空間。

就緒狀態。該進程不需要等待什么事件發生，隨時都可以執行，但CPU暫時還在執行另一個進程，所以該進程在一個就緒隊列中等待被內核調度。系統中可能同時有多個就緒的進程，那么該調度誰執行呢？內核的調度算法是基於優先級和時間片的，而且會根據每個進程的運行情況動態調整它的優先級和時間片，讓每個進程都能比較公平地得到機會執行，同時要兼顧用戶體驗，不能讓和用戶交互的進程響應太慢。


下面這個小程序從終端讀數據再寫回終端。
例 28.2. 阻塞讀終端
#include <unistd.h>
#include <stdlib.h>

int main(void)
{
 char buf[10];
 int n;
 n = read(STDIN_FILENO, buf, 10);
 if (n < 0) {
  perror("read STDIN_FILENO");
  exit(1);
 }
 write(STDOUT_FILENO, buf, n);
 return 0;
}

執行結果如下：
$ ./a.out  hello（回車） hello $ ./a.out  hello world（回車） hello worl$ d bash: d: command not found

第一次執行a.out的結果很正常，而第二次執行的過程有點特殊，現在分析一下：

Shell進程創建a.out進程，a.out進程開始執行，而Shell進程睡眠等待a.out進程退出。

a.out調用read時睡眠等待，直到終端設備輸入了換行符才從read返回，read只讀走10個字符，剩下的字符仍然保存在內核的終端設備輸入緩沖區中。

a.out進程打印並退出，這時Shell進程恢復運行，Shell繼續從終端讀取用戶輸入的命令，於是讀走了終端設備輸入緩沖區中剩下的字符d和換行符，把它當成一條命令解釋執行，結果發現執行不了，沒有d這個命令。

#include <unistd.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
int main(void)
{
        char buf[10];
        int n;
        fcntl(STDIN_FILENO,F_SETFL,O_NONBLOCK);
        n = read(STDIN_FILENO, buf, 10);
        if (n < 0) {
                perror("read STDIN_FILENO");
                exit(1);
        }
        write(STDOUT_FILENO, buf, n);
        return 0;
}

上面的意思是輸入終端資源暫時不可用

如果把 fcntl(STDIN_FILENO,F_SETFL,O_NONBLOCK);這句注釋掉

一直阻塞直到有數據輸入

如果在open一個設備時指定了O_NONBLOCK標志，read/write就不會阻塞。以read為例，如果設備暫時沒有數據可讀就返回-1，同時置errno為EWOULDBLOCK（或者EAGAIN，這兩個宏定義的值相同），表示本來應該阻塞在這里（would block，虛擬語氣），事實上並沒有阻塞而是直接返回錯誤，調用者應該試着再讀一次（again）。這種行為方式稱為輪詢（Poll），調用者只是查詢一下，而不是阻塞在這里死等，這樣可以同時監視多個設備：
while(1) {  非阻塞read(設備1);  if(設備1有數據到達)   處理數據;  非阻塞read(設備2);  if(設備2有數據到達)   處理數據;  ... }
如果read(設備1)是阻塞的，那么只要設備1沒有數據到達就會一直阻塞在設備1的read調用上，即使設備2有數據到達也不能處理，使用非阻塞I/O就可以避免設備2得不到及時處理。
非阻塞I/O有一個缺點，如果所有設備都一直沒有數據到達，調用者需要反復查詢做無用功，如果阻塞在那里，操作系統可以調度別的進程執行，就不會做無用功了。在使用非阻塞I/O時，通常不會在一個while循環中一直不停地查詢（這稱為Tight Loop），而是每延遲等待一會兒來查詢一下，以免做太多無用功，在延遲等待的時候可以調度其它進程執行。
while(1) {  非阻塞read(設備1);  if(設備1有數據到達)   處理數據;  非阻塞read(設備2);  if(設備2有數據到達)   處理數據;  ...  sleep(n); }
這樣做的問題是，設備1有數據到達時可能不能及時處理，最長需延遲n秒才能處理，而且反復查詢還是做了很多無用功。以后要學習的select(2)函數可以阻塞地同時監視多個設備，還可以設定阻塞等待的超時時間，從而圓滿地解決了這個問題。
以下是一個非阻塞I/O的例子。目前我們學過的可能引起阻塞的設備只有終端，所以我們用終端來做這個實驗。程序開始執行時在0、1、2文件描述符上自動打開的文件就是終端，但是沒有O_NONBLOCK標志。所以就像例 28.2 “阻塞讀終端”一樣，讀標准輸入是阻塞的。我們可以重新打開一遍設備文件/dev/tty（表示當前終端），在打開時指定O_NONBLOCK標志。
O_NONBLOCK 以不可阻斷的方式打開文件，也就是無論有無數據讀取或等待，都會立即返回進程之中。
例 28.3. 非阻塞讀終端
從終端設備或網絡讀則不一定，如果從終端輸入的數據沒有換行符，調用read讀終端設備就會阻塞
#include <unistd.h>
#include <fcntl.h>
#include <errno.h>
#include <string.h>
#include <stdlib.h>

#define MSG_TRY "try again\n"

int main(void)
{
char buf[10];
int fd, n;
fd = open("/dev/tty", O_RDONLY|O_NONBLOCK);
if(fd<0) {
perror("open /dev/tty");
exit(1);
}
tryagain:
n = read(fd, buf, 10);
if (n < 0) {
if (errno == EAGAIN) {
sleep(1);
write(STDOUT_FILENO, MSG_TRY, strlen(MSG_TRY));
goto tryagain;
} 
perror("read /dev/tty");
exit(1);
}
write(STDOUT_FILENO, buf, n);
close(fd);
return 0;
}

直到按下回車把之前的輸入輸出（最多10個），然后停止。



以下是用非阻塞I/O實現等待超時的例子。既保證了超時退出的邏輯又保證了有數據到達時處理延遲較小。

例 28.4. 非阻塞讀終端和等待超時

read：既可以返回正的字節數、0（表示到達文件末尾）也可以返回負值-1（表示出錯）

#include <unistd.h>
#include <fcntl.h>
#include <errno.h>
#include <string.h>
#include <stdlib.h>

#define MSG_TRY "try again\n"
#define MSG_TIMEOUT "timeout\n"

int main(void)
{
 char buf[10];
 int fd, n, i;
 fd = open("/dev/tty", O_RDONLY|O_NONBLOCK);
 if(fd<0) {
  perror("open /dev/tty");
  exit(1);
 }
 for(i=0; i<5; i++) {
  n = read(fd, buf, 10);
  if(n>=0)
   break;
  if(errno!=EAGAIN) {
   perror("read /dev/tty");
   exit(1);
  }
  sleep(1);
  write(STDOUT_FILENO, MSG_TRY, strlen(MSG_TRY));
 }
 if(i==5)
  write(STDOUT_FILENO, MSG_TIMEOUT, strlen(MSG_TIMEOUT));
 else
  write(STDOUT_FILENO, buf, n);
 close(fd);
 return 0;
}
轉載自：http://blog.163.com/bowen_tong/blog/static/20681717420126601118551/

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Linux系統編程 Linux系統編程 Linux系統編程——信號 linux系統編程--線程【Linux】關於Linux的系統編程總結 Linux系統編程-文件IO Linux系統編程—信號捕捉 Linux系統編程【5】——stty的學習 linux系統編程面試題 Linux系統編程—有名管道