https://www.zybuluo.com/yiltoncent/note/87461
對於這兩個名字很類似的函數,對於很多初學者來說,不容易搞清楚它們有什么不同,只知道按照函數用法使用。如果能很好的區分兩者,相信大家對於C語言和UNIX系統(包括LINUX)有更深入的了解。
在網上查找了一些資料,但是感覺不夠全面,一些答案只是從某個角度闡述,所以讓人覺得,這個也對,那個也對。但到底誰的表述更正確呢?其實都是對的,只是解釋的視角不同罷了。下面結合個人的理解做一些梳理。
1. 來源
從來源的角度看,兩者能很好的區分開,這也是兩者最顯而易見的區別:
open
是UNIX系統調用函數(包括LINUX等),返回的是文件描述符(File Descriptor),它是文件在文件描述符表里的索引。fopen
是ANSIC標准中的C語言庫函數,在不同的系統中應該調用不同的內核api。返回的是一個指向文件結構的指針。
PS:從來源來看,兩者是有千絲萬縷的聯系的,畢竟C語言的庫函數還是需要調用系統API實現的。
2. 移植性
這一點從上面的來源就可以推斷出來,`fopen`是C標准函數,因此擁有良好的移植性;而`open`是UNIX系統調用,移植性有限。如windows下相似的功能使用API函數`CreateFile`。
3. 適用范圍
open
返回文件描述符,而文件描述符是UNIX系統下的一個重要概念,UNIX下的一切設備都是以文件的形式操作。如網絡套接字、硬件設備等。當然包括操作普通正規文件(Regular File)。- fopen是用來操縱普通正規文件(Regular File)的。
4. 文件IO層次
如果從文件IO的角度來看,前者屬於低級IO函數,后者屬於高級IO函數。低級和高級的簡單區分標准是:誰離系統內核更近。低級文件IO運行在內核態,高級文件IO運行在用戶態。
5. 緩沖
- 緩沖文件系統
緩沖文件系統的特點是:在內存開辟一個“緩沖區”,為程序中的每一個文件使用;當執行讀文件的操作時,從磁盤文件將數據先讀入內存“緩沖區”,裝滿后再從內存“緩沖區”依此讀出需要的數據。執行寫文件的操作時,先將數據寫入內存“緩沖區”,待內存“緩沖區”裝滿后再寫入文件。由此可以看出,內存“緩沖區”的大小,影響着實際操作外存的次數,內存“緩沖區”越大,則操作外存的次數就少,執行速度就快、效率高。一般來說,文件“緩沖區”的大小隨機器 而定。fopen, fclose, fread, fwrite, fgetc, fgets, fputc, fputs, freopen, fseek, ftell, rewind
等。 - 非緩沖文件系統
緩沖文件系統是借助文件結構體指針來對文件進行管理,通過文件指針來對文件進行訪問,既可以讀寫字符、字符串、格式化數據,也可以讀寫二進制數據。非緩沖文件系統依賴於操作系統,通過操作系統的功能對文件進行讀寫,是系統級的輸入輸出,它不設文件結構體指針,只能讀寫二進制文件,但效率高、速度快,由於ANSI標准不再包括非緩沖文件系統,因此建議大家最好不要選擇它。open, close, read, write, getc, getchar, putc, putchar
等。
一句話總結一下,就是open
無緩沖,fopen
有緩沖。前者與read
, write
等配合使用, 后者與fread
,fwrite
等配合使用。
使用fopen
函數,由於在用戶態下就有了緩沖,因此進行文件讀寫操作的時候就減少了用戶態和內核態的切換(切換到內核態調用還是需要調用系統調用API:read
,write
);而使用open
函數,在文件讀寫時則每次都需要進行內核態和用戶態的切換;表現為,如果順序訪問文件,fopen
系列的函數要比直接調用open
系列的函數快;如果隨機訪問文件則相反。
這樣一總結梳理,相信大家對於兩個函數及系列函數有了一個更全面清晰的認識,也應該知道在什么場合下使用什么樣的函數更合適,效率更高。