RIO包
簡介
Rio包即為Robust io函數包。包中函數是對Linux基本I/O函數的封裝,使其更加健壯、高效,更適用於網絡編程。
分析
Rio包由rio_t結構體和系列函數組成。
首先是兩個不涉及緩沖區的函數rio_readn()
和rio_writen()
;
rio_readn 與 rio_writen
為了解釋這兩個函數存在的必要,我們先來看看基本IO函數write、read存在哪些問題。
以下摘自UNP:
字節流套接字上的read和write函數所表現的行為不同於通常的文件IO。字節流套接字上調用read或write輸入或輸出的字節數可能比請求的數量少,然而這不是出錯的狀態。這個現象的原因在於內核中用於套接字的緩沖區可能已經到達了極限。此時所需的是調用者再次調用read或write函數,以輸入或輸出剩余的字節。
再來談一談EINTR:
如果進程在一個慢系統調用(slow system call)中阻塞時,當捕獲到某個信號且相應信號處理函數返回時,這個系統調用被中斷,調用返回錯誤,設置errno為EINTR(相應的錯誤描述為“Interrupted system call”)。
以上兩點表明,在網絡編程中,你雖然調用read/write讀/寫了n個字符,但實際讀寫的數量可能比請求的數量少。
而rio包中的兩個函數解決了這一問題。
rio_readn
此函數嘗試從fd中讀取n個字符到usrbuf中,與read函數相比,它被信號處理函數中斷后會再次嘗試讀取。因此,在除了可讀字符數小於n情況下,該函數可以保證讀取n個字節。
ssize_t rio_readn(int fd, void *usrbuf, size_t n)
{
size_t nleft = n; //剩下未讀字符數
ssize_t nread;
char *bufp = usrbuf;
while (nleft > 0) {
if ((nread = read(fd, bufp, nleft)) < 0) {
if (errno == EINTR) //被信號處理函數中斷
nread = 0; //本次讀到0個字符,再次讀取
else
return -1; //出錯,errno由read設置
}
else if (nread == 0) //讀取到EOF
break;
nleft -= nread; //剩下的字符數減去本次讀到的字符數
bufp += nread; //緩沖區指針向右移動
}
//返回實際讀取的字符數
return (n - nleft); /* return >= 0 */
}
rio_writen
此函數同理,保證寫出n字節。
ssize_t rio_writen(int fd, void *usrbuf, size_t n)
{
size_t nleft = n;
ssize_t nwritten;
char *bufp = usrbuf;
while (nleft > 0) {
if ((nwritten = write(fd, bufp, nleft)) <= 0) {
if (errno == EINTR)
nwritten = 0;
else
return -1;
}
nleft -= nwritten;
bufp += nwritten;
}
return n;
}
接下來是帶有緩沖區的RIO函數。緩沖區存在的目的是為了減少因多次調用系統級IO函數,陷入內核態而帶來的額外開銷。詳情如下:
在Linux中,read 和 write 是基本的系統級I/O函數。當用戶進程使用read 和 write 讀寫linux的文件時,進程會從用戶態進入內核態,通過I/O操作讀取文件中的數據。內核態(內核模式)和用戶態(用戶模式)是linux的一種機制,用於限制應用可以執行的指令和可訪問的地址空間,這通過設置某個控制寄存器的位來實現。進程處於用戶模式下,它不允許發起I/O操作,所以它必須通過系統調用進入內核模式才能對文件進行讀取。
從用戶模式切換到內核模式,主要的開銷是處理器要將返回地址(當前指令的下一條指令地址)和額外的處理器狀態(寄存器)壓入到棧中,這些數據到會被壓到內核棧而不是用戶棧。另外,一個進程使用系統調用還隱含了一點——調用系統調用的進程可能會被搶占。當內核代表用戶執行系統調用時,若該系統調用被阻塞,該進程就會進入休眠,然后由內核選擇一個就緒狀態,當前優先級最高的進程運行。另外,即使系統調用沒有被阻塞,當系統調用結束,從內核態返回時,若在系統調用期間出現了一個優先級更高的進程,則該進程會搶占使用了系統調用的進程。內核態返回會返回到優先級高的進程,而不是原本的進程。
rio_t 結構體
typedef struct {
int rio_fd; //與內部緩沖區關聯的描述符
int rio_cnt; //緩沖區中剩下的字節數
char *rio_bufptr; //指向緩沖區中下一個未讀的字節
char rio_buf[RIO_BUFSIZE];
} rio_t;
rio_readinitb
初始化函數
void rio_readinitb(rio_t *rp, int fd)
{
rp->rio_fd = fd;
rp->rio_cnt = 0;
rp->rio_bufptr = rp->rio_buf;
}
rio_read
此函數首先檢查緩沖區是否為空,若為空,則調用read從fd中讀取最數量非的數據填充緩沖區。若不為空則從緩沖區中取出n個字節。若緩沖區中剩余字節數不足n,則將緩沖區中全部取出,並返回讀取到的字節數。
static ssize_t rio_read(rio_t *rp, char *usrbuf, size_t n)
{
int cnt;
while (rp->rio_cnt <= 0) { //緩沖區為空,調用read填充
rp->rio_cnt = read(rp->rio_fd, rp->rio_buf,
sizeof(rp->rio_buf));
if (rp->rio_cnt < 0) {
if (errno != EINTR) /* Interrupted by sig handler return */
return -1;
}
else if (rp->rio_cnt == 0) /* EOF */
return 0;
else
rp->rio_bufptr = rp->rio_buf; /* Reset buffer ptr */
}
/* Copy min(n, rp->rio_cnt) bytes from internal buf to user buf */
cnt = n;
if (rp->rio_cnt < n)
cnt = rp->rio_cnt;
memcpy(usrbuf, rp->rio_bufptr, cnt);
rp->rio_bufptr += cnt;
rp->rio_cnt -= cnt;
return cnt;
}
rio_readnb
此函數類似rio_readn,不過因為加入了緩沖區,所以減少了陷入內核態時的開銷。
ssize_t rio_readnb(rio_t *rp, void *usrbuf, size_t n)
{
size_t nleft = n;
ssize_t nread;
char *bufp = usrbuf;
while (nleft > 0) {
if ((nread = rio_read(rp, bufp, nleft)) < 0)
return -1; /* errno set by read() */
else if (nread == 0)
break; /* EOF */
nleft -= nread;
bufp += nread;
}
return (n - nleft); /* return >= 0 */
}
rio_readlineb
帶緩沖的讀取一行,返回字節數包括換行符。
ssize_t rio_readlineb(rio_t *rp, void *usrbuf, size_t maxlen)
{
int n, rc;
char c, *bufp = usrbuf;
for (n = 1; n < maxlen; n++) {
if ((rc = rio_read(rp, &c, 1)) == 1) {
*bufp++ = c;
if (c == '\n') {
n++;
break;
}
} else if (rc == 0) {
if (n == 1)
return 0; //第一次讀取就到了EOF
else
break; //讀了一些數據后遇到EOF
} else
return -1; /* Error */
}
*bufp = 0;
return n-1;
}
參考:
《UNIX網絡編程》
《深入理解計算機系統》
http://blog.csdn.net/u013613341/article/details/51019075