文件I/O與標准I/O

本文轉載自查看原文 2017-03-06 20:15 1454

一、先來了解下什么是文件I/O和標准I/O：

文件I/O：文件I/O稱之為不帶緩存的IO（unbuffered I/O)。不帶緩存指的是每個read，write都調用內核中的一個系統調用。也就是一般所說的低級I/O——操作系統提供的基本IO服務，與os綁定，特定於linix或unix平台。

標准I/O：標准I/O是ANSI C建立的一個標准I/O模型，是一個標准函數包和stdio.h頭文件中的定義，具有一定的可移植性。標准I/O庫處理很多細節。例如緩存分配，以優化長度執行I/O等。標准的I/O提供了三種類型的緩存。

（1）全緩存：當填滿標准I/O緩存后才進行實際的I/O操作。
（2）行緩存：當輸入或輸出中遇到新行符時，標准I/O庫執行I/O操作。
（3）不帶緩存：stderr就是了。

二、二者的區別

文件I/O 又稱為低級磁盤I/O，遵循POSIX相關標准。任何兼容POSIX標准的操作系統上都支持文件I/O。標准I/O被稱為高級磁盤I/O，遵循ANSI C相關標准。只要開發環境中有標准I/O庫，標准I/O就可以使用。（Linux 中使用的是GLIBC，它是標准C庫的超集。不僅包含ANSI C中定義的函數，還包括POSIX標准中定義的函數。因此，Linux 下既可以使用標准I/O，也可以使用文件I/O）。

通過文件I/O讀寫文件時，每次操作都會執行相關系統調用。這樣處理的好處是直接讀寫實際文件，壞處是頻繁的系統調用會增加系統開銷，標准I/O可以看成是在文件I/O的基礎上封裝了緩沖機制。先讀寫緩沖區，必要時再訪問實際文件，從而減少了系統調用的次數。

文件I/O中用文件描述符表現一個打開的文件，可以訪問不同類型的文件如普通文件、設備文件和管道文件等。而標准I/O中用FILE（流）表示一個打開的文件，通常只用來訪問普通文件。

三、最后來看下他們使用的函數

	標准ＩＯ	文件ＩＯ(低級IO)
打開	fopen,freopen,fdopen	open
關閉	fclose	close
讀	getc,fgetc,getchar fgets,gets fread	read
寫	putc,fputc,putchar fputs,puts, fwrite	write

1.fopen與open

標准I/O使用fopen函數打開一個文件：

FILE* fp=fopen(const char* path,const char *mod)

其中path是文件名，mod用於指定文件打開的模式的字符串，比如"r","w","w+","a"等等，可以加上字母b用以指定以二進制模式打開（對於 *nix系統，只有一種文件類型，因此沒有區別）,如果成功打開，返回一個FILE文件指針，如果失敗返回NULL,這里的文件指針並不是指向實際的文件，而是一個關於文件信息的數據包，其中包括文件使用的緩沖區信息。

文件IO使用open函數用於打開一個文件：

int fd=open(char *name,int how);

與fopen類似，name表示文件名字符串，而how指定打開的模式：O_RDONLY(只讀),O_WRONLY(只寫）,O_RDWR （可讀可寫),還有其他模式請man 2 open。成功返回一個正整數稱為文件描述符，這與標准I/O顯著不同，失敗的話返回-1，與標准I/O返回NULL也是不同的。

2.fclose與close

與打開文件相對的，標准I/O使用fclose關閉文件，將文件指針傳入即可，如果成功關閉，返回0，否則返回EOF
比如：

if(fclose(fp)!=0)
printf("Error in closing file");

而文件IO使用close用於關閉open打開的文件，與fclose類似，只不過當錯誤發生時返回的是-1，而不是EOF，成功關閉同樣是返回0。C語言用error code來進行錯誤處理的傳統做法。

3. 讀文件，getc,fscanf,fgets和read

標准I/O中進行文件讀取可以使用getc，一個字符一個字符的讀取，也可以使用gets（讀取標准io讀入的）、fgets以字符串單位進行讀取（讀到遇到的第一個換行字符的后面），gets（接受一個參數，文件指針）不判斷目標數組是否能夠容納讀入的字符，可能導致存儲溢出(不建議使用），而fgets使用三個參數：
char * fgets(char *s, int size, FILE *stream);

第一個參數和gets一樣，用於存儲輸入的地址，第二個參數為整數，表示輸入字符串的最大長度，最后一個參數就是文件指針，指向要讀取的文件。最后是fscanf，與scanf類似，只不過增加了一個參數用於指定操作的文件，比如fscanf(fp,"%s",words)
文件IO中使用read函數用於讀取open函數打開的文件，函數原型如下：

ssize_t numread=read(int fd,void *buf,size_t qty);

其中fd就是open返回的文件描述符，buf用於存儲數據的目的緩沖區，而qty指定要讀取的字節數。如果成功讀取，就返回讀取的字節數目（小於等於qty）

4. 判斷文件結尾

如果嘗試讀取達到文件結尾，標准IO的getc會返回特殊值EOF，而fgets碰到EOF會返回NULL,而對於*nix的read函數，情況有所不同。read讀取qty指定的字節數，最終讀取的數據可能沒有你所要求的那么多（qty），而當讀到結尾再要讀的話，read函數將返回0.

5. 寫文件：putc,fputs,fprintf和write

與讀文件相對應的，標准C語言I/O使用putc寫入字符，比如：

putc(ch,fp);

第一個參數是字符，第二個是文件指針。而fputs與此類似：

fputs(buf,fp);

僅僅是第一個參數換成了字符串地址。而fprintf與printf類似，增加了一個參數用於指定寫入的文件，比如：

fprintf(stdout,"Hello %s.\n","dennis");

切記fscanf和fprintf將FILE指針作為第一個參數，而putc,fputs則是作為第二個參數。

在文件IO中提供write函數用於寫入文件，原型與read類似：

ssize_t result=write(int fd,void *buf ,size_t amt);

fd是文件描述符，buf是將要寫入的內存數據，amt是要寫的字節數。如果寫入成功返回寫入的字節數，通過result與amt的比較可以判斷是否寫入正常，如果寫入失敗返回-1

6. 隨機存取：fseek()、ftell()和lseek()

標准I/O使用fseek和ftell用於文件的隨機存取，先看看fseek函數原型

int fseek(FILE *stream, long offset, int whence);

第一個參數是文件指針，第二個參數是一個long類型的偏移量（offset），表示從起始點開始移動的距離。第三個參數就是用於指定起始點的模式，stdio.h指定了下列模式常量：

SEEK_SET            文件開始處
SEEK_CUR            當前位置
SEEK_END            文件結尾處

看幾個調用例子：
fseek(fp,0L,SEEK_SET); //找到文件的開始處
fseek(fp,0L,SEEK_END); //定位到文件結尾處
fseek(fp,2L,SEEK_CUR); //文件當前位置向前移動2個字節數

而ftell函數用於返回文件的當前位置，返回類型是一個long類型，比如下面的調用：

fseek(fp,0L,SEEK_END);//定位到結尾
long last=ftell(fp); //返回當前位置

那么此時的last就是文件指針fp指向的文件的字節數。

與標准I/O類似，*nix系統提供了lseek來完成fseek的功能，原型如下：

off_t lseek(int fildes, off_t offset, int whence);

fildes是文件描述符，而offset也是偏移量，whence同樣是指定起始點模式，唯一的不同是lseek有返回值，如果成功就返回指針變化前的位置，否則返回-1。whence的取值與fseek相同：SEEK_SET,SEEK_CUR,SEEK_END，但也可以用整數 0,1,2相應代替。

四、系統調用與庫函數

上面我們一直在討論文件I/O與標准I/O的區別，其實可以這樣說，文件I/O是系統調用、標准I/O是庫函數，看下面這張圖：

POSIX：Portable Operating System Interface 可移植操作系統接口

ANSI：American National Standrads Institute 美國國家標准學會

1、系統調用

操作系統負責管理和分配所有的計算機資源。為了更好地服務於應用程序，操作系統提供了一組特殊接口——系統調用。通過這組接口用戶程序可以使用操作系統內核提供的各種功能。例如分配內存、創建進程、實現進程之間的通信等。

為什么不允許程序直接訪問計算機資源？答案是不安全。單片機開發中，由於不需要操作系統，所以開發人員可以編寫代碼直接訪問硬件。而在32位嵌入式系統中通常都要運行操作系統，所以開發人員可以編寫代碼直接訪問硬件。而在32位嵌入式系統中通常都要運行操作系統，程序訪問資源的方式都發生了改變。操作系統基本上都支持多任務，即同時可以運行多個程序。如果允許程序直接訪問系統資源，肯定會帶來很多問題。因此，所有軟硬件資源的管理和分配都有操作系統負責。程序要獲取資源（如分配內存，讀寫串口）必須由操作系統來完成，即用戶程序向操作系統發出服務請求，操作系統收到請求后執行相關的代碼來處理。

用戶程序向操作系統提出請求的接口就是系統調用。所有的操作系統都會提供系統調用接口，只不過不同的操作系統提供的系統調用接口各不相同。Linux 系統調用接口非常精簡，它繼承了Unix 系統調用中最基本的和最有用的部分。這些系統調用按照功能大致可分為進程控制、進程間通信、文件系統控制、存儲管理、網絡管理、套接字控制、用戶管理等幾類。

2、庫函數

庫函數可以說是對系統調用的一種封裝，因為系統調用是面對的是操作系統，系統包括Linux、Windows等，如果直接系統調用，會影響程序的移植性，所以這里使用了庫函數，比如說C庫，這樣只要系統中安裝了C庫，就都可以使用這些函數，比如printf() scanf()等，C庫相當於對系統函數進行了翻譯，使我們的APP可以調用這些函數；

3、用戶編程接口API

前面提到利用系統調用接口程序可以訪問各種資源，但在實際開發中程序並不直接使用系統調用接口，而是使用用戶編程接口（API）。為什么不直接使用系統調用接口呢？

原因如下：

1）系統調用接口功能非常簡單，無法滿足程序的需求。

2）不同操作系統的系統調用接口不兼容，程序移植時工作量大。

用戶編程接口通俗的解釋就是各種庫（最重要的就是C庫）中的函數。為了提高開發效率，C庫中實現了很多函數。這些函數實現了常用的功能，供程序員調用。這樣一來，程序員不需要自己編寫這些代碼，直接調用庫函數就可以實現基本功能，提高了代碼的復用率。使用用戶編程接口還有一個好處：程序具有良好的可移植性。幾乎所有的操作系統上都實現了C庫，所以程序通常只需要重新編譯一下就可以在其他操作系統下運行。

用戶編程接口（API）在實現時，通常都要依賴系統調用接口。例如，創建進程的API函數fork()對應於內核空間的sys_fork()系統調用。很多API函數西亞我哦通過多個系統調用來完成其功能。還有一些API函數不要調用任何系統調用。

在Linux 中用戶編程接口（API）遵循了在Unix中最流行的應用編程界面標准——POSIX標准。POSIX標准是由IEEE和ISO/IEC共同開發的標准系統。該標准基於當時想用的Unix 實踐和經驗，描述了操作系統的系統調用編程接口（實際上就是API），用於保證應用程序可以在源代碼一級商多種操作系統上運行。這些系統調用編程接口主要是通過C庫（libc )實現的。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Java 標准 I/O 介紹 Linux文件I/O Systemverilog 文件I/O I/O 磁盤I/O的三種方式對比：標准I/O、直接 I/O、mmap 磁盤I/O的三種方式對比：標准I/O、直接 I/O、mmap Linux中的標准文件I/O流文件I/O之ioctl函數 linux中文件I/O操作（系統I/O） I/O設備——I/O設備的概念