一、先來了解下什么是文件I/O和標准I/O:
文件I/O:文件I/O稱之為不帶緩存的IO(unbuffered I/O)。不帶緩存指的是每個read,write都調用內核中的一個系統調用。也就是一般所說的低級I/O——操作系統提供的基本IO服務,與os綁定,特定於linix或unix平台。
標准I/O:標准I/O是ANSI C建立的一個標准I/O模型,是一個標准函數包和stdio.h頭文件中的定義,具有一定的可移植性。標准I/O庫處理很多細節。例如緩存分配,以優化長度執行I/O等。標准的I/O提供了三種類型的緩存。
(1)全緩存:當填滿標准I/O緩存后才進行實際的I/O操作。
(2)行緩存:當輸入或輸出中遇到新行符時,標准I/O庫執行I/O操作。
(3)不帶緩存:stderr就是了。
二、二者的區別
文件I/O 又稱為低級磁盤I/O,遵循POSIX相關標准。任何兼容POSIX標准的操作系統上都支持文件I/O。標准I/O被稱為高級磁盤I/O,遵循ANSI C相關標准。只要開發環境中有標准I/O庫,標准I/O就可以使用。(Linux 中使用的是GLIBC,它是標准C庫的超集。不僅包含ANSI C中定義的函數,還包括POSIX標准中定義的函數。因此,Linux 下既可以使用標准I/O,也可以使用文件I/O)。
通過文件I/O讀寫文件時,每次操作都會執行相關系統調用。這樣處理的好處是直接讀寫實際文件,壞處是頻繁的系統調用會增加系統開銷,標准I/O可以看成是在文件I/O的基礎上封裝了緩沖機制。先讀寫緩沖區,必要時再訪問實際文件,從而減少了系統調用的次數。
文件I/O中用文件描述符表現一個打開的文件,可以訪問不同類型的文件如普通文件、設備文件和管道文件等。而標准I/O中用FILE(流)表示一個打開的文件,通常只用來訪問普通文件。
三、最后來看下他們使用的函數
|
標准IO |
文件IO(低級IO) |
打開 |
fopen,freopen,fdopen |
open |
關閉 |
fclose |
close |
讀 |
getc,fgetc,getchar |
read |
寫 |
putc,fputc,putchar |
write |
1.fopen與open
標准I/O使用fopen函數打開一個文件:
FILE* fp=fopen(const char* path,const char *mod)
其中path是文件名,mod用於指定文件打開的模式的字符串,比如"r","w","w+","a"等等,可以加上字母b用以指定以二進制模式打開(對於 *nix系統,只有一種文件類型,因此沒有區別),如果成功打開,返回一個FILE文件指針,如果失敗返回NULL,這里的文件指針並不是指向實際的文 件,而是一個關於文件信息的數據包,其中包括文件使用的緩沖區信息。
文件IO使用open函數用於打開一個文件:
int fd=open(char *name,int how);
與fopen類似,name表示文件名字符串,而how指定打開的模式:O_RDONLY(只讀),O_WRONLY(只寫),O_RDWR (可讀可寫),還有其他模式請man 2 open。成功返回一個正整數稱為文件描述符,這與標准I/O顯著不同,失敗的話返回-1,與標准I/O返回NULL也是不同的。
2.fclose與close
與打開文件相對的,標准I/O使用fclose關閉文件,將文件指針傳入即可,如果成功關閉,返回0,否則返回EOF
比如:
if(fclose(fp)!=0)
printf("Error in closing file");
而文件IO使用close用於關閉open打開的文件,與fclose類似,只不過當錯誤發生時返回的是-1,而不是EOF,成功關閉同樣是返回0。C語言用error code來進行錯誤處理的傳統做法。
3. 讀文件,getc,fscanf,fgets和read
標 准I/O中進行文件讀取可以使用getc,一個字符一個字符的讀取,也可以使用gets(讀取標准io讀入的)、fgets以字符串單位進行讀取(讀到遇 到的第一個換行字符的后面),gets(接受一個參數,文件指針)不判斷目標數組是否能夠容納讀入的字符,可能導致存儲溢出(不建議使用),而fgets使用三個參數:
char * fgets(char *s, int size, FILE *stream);
第一個參數和gets一樣,用於存儲輸入的地址,第二個參數為整數,表示輸入字符串的最大長度,最后一個參數就是文件指針,指向要讀取的文件。最 后是fscanf,與scanf類似,只不過增加了一個參數用於指定操作的文件,比如fscanf(fp,"%s",words)
文件IO中使用read函數用於讀取open函數打開的文件,函數原型如下:
ssize_t numread=read(int fd,void *buf,size_t qty);
其中fd就是open返回的文件描述符,buf用於存儲數據的目的緩沖區,而qty指定要讀取的字節數。如果成功讀取,就返回讀取的字節數目(小於等於qty)
4. 判斷文件結尾
如果嘗試讀取達到文件結尾,標准IO的getc會返回特殊值EOF,而fgets碰到EOF會返回NULL,而對於*nix的read函數,情況有所不 同。read讀取qty指定的字節數,最終讀取的數據可能沒有你所要求的那么多(qty),而當讀到結尾再要讀的話,read函數將返回0.
5. 寫文件:putc,fputs,fprintf和write
與讀文件相對應的,標准C語言I/O使用putc寫入字符,比如:
putc(ch,fp);
第一個參數是字符,第二個是文件指針。而fputs與此類似:
fputs(buf,fp);
僅僅是第一個參數換成了字符串地址。而fprintf與printf類似,增加了一個參數用於指定寫入的文件,比如:
fprintf(stdout,"Hello %s.\n","dennis");
切記fscanf和fprintf將FILE指針作為第一個參數,而putc,fputs則是作為第二個參數。
在文件IO中提供write函數用於寫入文件,原型與read類似:
ssize_t result=write(int fd,void *buf ,size_t amt);
fd是文件描述符,buf是將要寫入的內存數據,amt是要寫的字節數。如果寫入成功返回寫入的字節數,通過result與amt的比較可以判斷是否寫入正常,如果寫入失敗返回-1
6. 隨機存取:fseek()、ftell()和lseek()
標准I/O使用fseek和ftell用於文件的隨機存取,先看看fseek函數原型
int fseek(FILE *stream, long offset, int whence);
第一個參數是文件指針,第二個參數是一個long類型的偏移量(offset),表示從起始點開始移動的距離。第三個參數就是用於指定起始點的模式,stdio.h指定了下列模式常量:
SEEK_SET 文件開始處
SEEK_CUR 當前位置
SEEK_END 文件結尾處
看幾個調用例子:
fseek(fp,0L,SEEK_SET); //找到文件的開始處
fseek(fp,0L,SEEK_END); //定位到文件結尾處
fseek(fp,2L,SEEK_CUR); //文件當前位置向前移動2個字節數
而ftell函數用於返回文件的當前位置,返回類型是一個long類型,比如下面的調用:
fseek(fp,0L,SEEK_END);//定位到結尾
long last=ftell(fp); //返回當前位置
那么此時的last就是文件指針fp指向的文件的字節數。
與標准I/O類似,*nix系統提供了lseek來完成fseek的功能,原型如下:
off_t lseek(int fildes, off_t offset, int whence);
fildes是文件描述符,而offset也是偏移量,whence同樣是指定起始點模式,唯一的不同是lseek有返回值,如果成功就 返回指針變化前的位置,否則返回-1。whence的取值與fseek相同:SEEK_SET,SEEK_CUR,SEEK_END,但也可以用整數 0,1,2相應代替。
四、系統調用與庫函數
上面我們一直在討論文件I/O與標准I/O的區別,其實可以這樣說,文件I/O是系統調用、標准I/O是庫函數,看下面這張圖:
POSIX:Portable Operating System Interface 可移植操作系統接口
ANSI:American National Standrads Institute 美國國家標准學會
1、系統調用
操作系統負責管理和分配所有的計算機資源。為了更好地服務於應用程序,操作系統提供了一組特殊接口——系統調用。通過這組接口用戶程序可以使用操作系統內核提供的各種功能。例如分配內存、創建進程、實現進程之間的通信等。
為什么不允許程序直接訪問計算機資源?答案是不安全。單片機開發中,由於不需要操作系統,所以開發人員可以編寫代碼直接訪問硬件。而在32位嵌入式系統中通常都要運行操作系統,所以開發人員可以編寫代碼直接訪問硬件。而在32位嵌入式系統中通常都要運行操作系統,程序訪問資源的方式都發生了改變。操作系統基本上都支持多任務,即同時可以運行多個程序。如果允許程序直接訪問系統資源,肯定會帶來很多問題。因此,所有軟硬件資源的管理和分配都有操作系統負責。程序要獲取資源(如分配內存,讀寫串口)必須由操作系統來完成,即用戶程序向操作系統發出服務請求,操作系統收到請求后執行相關的代碼來處理。
用戶程序向操作系統提出請求的接口就是系統調用。所有的操作系統都會提供系統調用接口,只不過不同的操作系統提供的系統調用接口各不相同。Linux 系統調用接口非常精簡,它繼承了Unix 系統調用中最基本的和最有用的部分。這些系統調用按照功能大致可分為進程控制、進程間通信、文件系統控制、存儲管理、網絡管理、套接字控制、用戶管理等幾類。
2、庫函數
庫函數可以說是對系統調用的一種封裝,因為系統調用是面對的是操作系統,系統包括Linux、Windows等,如果直接系統調用,會影響程序的移植性,所以這里使用了庫函數,比如說C庫,這樣只要系統中安裝了C庫,就都可以使用這些函數,比如printf() scanf()等,C庫相當於對系統函數進行了翻譯,使我們的APP可以調用這些函數;
3、用戶編程接口API
前面提到利用系統調用接口程序可以訪問各種資源,但在實際開發中程序並不直接使用系統調用接口,而是使用用戶編程接口(API)。為什么不直接使用系統調用接口呢?
原因如下:
1)系統調用接口功能非常簡單,無法滿足程序的需求。
2)不同操作系統的系統調用接口不兼容,程序移植時工作量大。
用戶編程接口通俗的解釋就是各種庫(最重要的就是C庫)中的函數。為了提高開發效率,C庫中實現了很多函數。這些函數實現了常用的功能,供程序員調用。這樣一來,程序員不需要自己編寫這些代碼,直接調用庫函數就可以實現基本功能,提高了代碼的復用率。使用用戶編程接口還有一個好處:程序具有良好的可移植性。幾乎所有的操作系統上都實現了C庫,所以程序通常只需要重新編譯一下就可以在其他操作系統下運行。
用戶編程接口(API)在實現時,通常都要依賴系統調用接口。例如,創建進程的API函數fork()對應於內核空間的sys_fork()系統調用。很多API函數西亞我哦通過多個系統調用來完成其功能。還有一些API函數不要調用任何系統調用。
在Linux 中用戶編程接口(API)遵循了在Unix中最流行的應用編程界面標准——POSIX標准。POSIX標准是由IEEE和ISO/IEC共同開發的標准系統。該標准基於當時想用的Unix 實踐和經驗,描述了操作系統的系統調用編程接口(實際上就是API),用於保證應用程序可以在源代碼一級商多種操作系統上運行。這些系統調用編程接口主要是通過C庫(libc )實現的。