二進制文件不是以ASCII代碼存放數據的,它將內存中數據存儲形式不加轉換地傳送到磁盤文件,因此它又稱為內存數據的映像文件。因為文件中的信息不是字符數據,而是字節中的二進制形式的信息,因此它又稱為字節文件。
對二進制文件的操作也需要先打開文件,用完后要關閉文件。在打開時要用ios::binary指定為以二進制形式傳送和存儲。二進制文件除了可以作為輸入文件或輸出文件外,還可以是既能輸入又能輸出的文件。這是和ASCII文件不同的地方。
用成員函數read和write讀寫二進制文件
對二進制文件的讀寫主要用istream類的成員函數read和write來實現。這兩個成員函數的原型為
istream& read(char *buffer,int len);
ostream& write(const char * buffer,int len);
字符指針buffer指向內存中一段存儲空間。len是讀寫的字節數。調用的方式為:
a. write(p1,50);
b. read(p2,30);
上面第一行中的a是輸出文件流對象,write函數將字符指針p1所給出的地址開始的50個字節的內容不加轉換地寫到磁盤文件中。在第二行中,b是輸入文件流對象,read 函數從b所關聯的磁盤文件中,讀入30個字節(或遇EOF結束),存放在字符指針p2所指的一段空間內。
[例13.14] 將一批數據以二進制形式存放在磁盤文件中。
#include <fstream> using namespace std; struct student { char name[20]; int num; int age; char sex; }; int main( ) { student stud[3]={"Li",1001,18,'f',"Fun",1002,19,'m',"Wang",1004,17,'f'}; ofstream outfile("stud.dat",ios::binary); if(!outfile) { cerr<<"open error!"<<endl; abort( );//退出程序 } for(int i=0;i<3;i++) outfile.write((char*)&stud[i],sizeof(stud[i])); outfile.close( ); return 0; }
用成員函數write向stud.dat輸出數據,從前面給出的write函數的原型可以看出: 第1個形參是指向char型常變量的指針變量buffer,之所以用const聲明,是因為不允許通過指針改變其指向數據的值。形參要求相應的實參是字符指針或字符串的首地址。現在要將結構體數組的一個元素(包含4個成員)一次輸出到磁盤文件stud.dat。&tud[i] 是結構體數組第i個元素的首地址,但這是指向結構體的指針,與形參類型不匹配。因此 要用(char *)把它強制轉換為字符指針。第2個參數是指定一次輸出的字節數。sizeof (stud[i])的值是結構體數組的一個元素的字節數。調用一次write函數,就將從&tud[i]開始的結構體數組的一個元素輸出到磁盤文件中,執行3次循環輸出結構體數組的3個元素。
其實可以一次輸出結構體數組的個元素,將for循環的兩行改為以下一行:
outfile.write((char*)&stud[0],sizeof(stud));
執行一次write函數即輸出了結構體數組的全部數據。
abort函數的作用是退出程序,與exit作用相同。
可以看到,用這種方法一次可以輸出一批數據,效率較高。在輸出的數據之間不必加入空格,在一次輸出之后也不必加回車換行符。在以后從該文件讀入數據時不是靠空格作為數據的間隔,而是用字節數來控制。
例13.15] 將剛才以二進制形式存放在磁盤文件中的數據讀入內存並在顯示器上顯示。
#include <fstream> using namespace std; struct student { string name; int num; int age; char sex; }; int main( ) { student stud[3]; int i; ifstream infile("stud.dat",ios::binary); if(!infile) { cerr<<"open error!"<<endl; abort( ); } for(i=0;i<3;i++) infile.read((char*)&stud[i],sizeof(stud[i])); infile.close( ); for(i=0;i<3;i++) { cout<<"NO."<<i+1<<endl; cout<<"name:"<<stud[i].name<<endl; cout<<"num:"<<stud[i].num<<endl;; cout<<"age:"<<stud[i].age<<endl; cout<<"sex:"<<stud[i].sex<<endl<<endl; } return 0; }
請思考,能否一次讀入文件中的全部數據,如:
infile.read((char*)&stud[0],sizeof(stud));
答案是可以的,將指定數目的字節讀入內存,依次存放在以地址&tud[0]開始的存儲空間中。要注意讀入的數據的格式要與存放它的空間的格式匹配。由於磁盤文件中的數據是從內存中結構體數組元素得來的,因此它仍然保留結構體元素的數據格式。現在再讀入內存,存放在同樣的結構體數組中,這必然是匹配的。如果把它放到一個整型數組中,就不匹配了,會出錯。
與文件指針有關的流成員函數
在磁盤文件中有一個文件指針,用來指明當前應進行讀寫的位置。在輸入時每讀入 一個宇節,指針就向后移動一個字節。在輸出時每向文件輸出一個字節,指針就向后移動 一個字節,隨着輸出文件中字節不斷增加,指針不斷后移。對於二進制文件,允許對指針進行控制,使它按用戶的意圖移動到所需的位置,以便在該位置上進行讀寫。文件流提供 一些有關文件指針的成員函數。為了查閱方便,將它們歸納為表13.7,並作必要的說明。
成員函數 | 作 用 |
---|---|
gcount() | 返回最后一次輸入所讀入的字節數 |
tellg() | 返回輸入文件指針的當前位置 |
seekg(文件中的位置) | 將輸入文件中指針移到指定的位置 |
seekg(位移量, 參照位置) | 以參照位置為基礎移動若干字節 |
tellp() | 返回輸出文件指針當前的位置 |
seekp(文件中的位置) | 將輸出文件中指針移到指定的位置 |
seekp(位移量, 參照位置) | 以參照位置為基礎移動若干字節 |
幾點說明:
1) 這些函數名的第一個字母或最后一個字母不是g就是p。帶 g的是用於輸入的函數(g是get的第一個字母,以g作為輸入的標識,容易理解和記憶), 帶p的是用於輸出的函數(P是put的第一個字母,以P作為輸出的標識)。例如有兩個 tell 函數,tellg用於輸入文件,tellp用於輸出文件。同樣,seekg用於輸入文件,seekp用於輸出文件。以上函數見名知意,一看就明白,不必死記。
如果是既可輸入又可輸出的文件,則任意用seekg或seekp。
2) 函數參數中的“文件中的位置”和“位移量”已被指定為long型整數,以字節為單位。“參照位置”可以是下面三者之一:
ios::beg 文件開頭(beg是begin的縮寫),這是默認值。
ios::cur 指針當前的位置(cur是current的縮寫)。
ios::end 文件末尾。
它們是在ios類中定義的枚舉常量。舉例如下:
infile.seekg(100); //輸入文件中的指針向前移到字節位置
infile.seekg(-50,ios::cur); //輸入文件中的指針從當前位置后移字節
outfile.seekp(-75,ios::end); //輸出文件中的指針從文件尾后移字節
隨機訪問二進制數據文件
一般情況下讀寫是順序進行的,即逐個字節進行讀寫。但是對於二進制數據文件來說,可以利用上面的成員函數移動指針,隨機地訪問文件中任一位置上的數據,還可以修改文件中的內容。
[例13.16] 有個學生的數據,要求:
- 把它們存到磁盤文件中;
- 將磁盤文件中的第,3,5個學生數據讀入程序,並顯示出來;
- 將第個學生的數據修改后存回磁盤文件中的原有位置。
- 從磁盤文件讀入修改后的個學生的數據並顯示出來。
要實現以上要求,需要解決個問題:
- 由於同一磁盤文件在程序中需要頻繁地進行輸入和輸出,因此可將文件的工作方式指定為輸入輸出文件,即ios::in|ios::out|ios::binary。
- 正確計算好每次訪問時指針的定位,即正確使用seekg或seekp函數。
- 正確進行文件中數據的重寫(更新)。
#include <fstream> using namespace std; struct student { int num; char name[20]; float score; }; int main( ) { student stud[5]={1001,"Li",85,1002,"Fun",97.5,1004,"Wang",54,1006,"Tan",76.5,1010,"ling",96}; fstream iofile("stud.dat",ios::in|ios::out|ios::binary); //用fstream類定義輸入輸出二進制文件流對象iofile if(!iofile) { cerr<<"open error!"<<endl; abort( ); } for(int i=0;i<5;i++) //向磁盤文件輸出個學生的數據 iofile.write((char *)&stud[i],sizeof(stud[i])); student stud1[5]; //用來存放從磁盤文件讀入的數據 for(int i=0;i<5;i=i+2) { iofile.seekg(i*sizeof(stud[i]),ios::beg); //定位於第,2,4學生數據開頭 //先后讀入個學生的數據,存放在stud1[0],stud[1]和stud[2]中 iofile.read((char *)&stud1[i/2],sizeof(stud1[0])); //輸出stud1[0],stud[1]和stud[2]各成員的值 cout<<stud1[i/2].num<<" "<<stud1[i/2].name<<" "<<stud1[i/2].score<<endl; } cout<<endl; stud[2].num=1012; //修改第個學生(序號為)的數據 strcpy(stud[2].name,"Wu"); stud[2].score=60; iofile.seekp(2*sizeof(stud[0]),ios::beg); //定位於第個學生數據的開頭 iofile.write((char *)&stud[2],sizeof(stud[2])); //更新第個學生數據 iofile.seekg(0,ios::beg); //重新定位於文件開頭 for(int i=0;i<5;i++) { iofile.read((char *)&stud[i],sizeof(stud[i])); //讀入個學生的數據 cout<<stud[i].num<<" "<<stud[i].name<<" "<<stud[i].score<<endl; } iofile.close( ); return 0; }
本程序也可以將磁盤文件stud.dat先后定義為輸出文件和輸入文件,在結束第一次的輸出之后關閉該文件,然后再按輸入方式打開它,輸入完后再關閉它,然后再按輸出方式打開,再關閉,再按輸入方式打開它,輸入完后再關閉。顯然這是很煩瑣和不方便的。 在程序中把它指定為輸入輸出型的二進制文件。這樣,不僅可以向文件添加新的數據或讀入數據,還可以修改(更新)數據。利用這些功能,可以實現比較復雜的輸入輸出任務。
請注意,不能用ifstream或ofstream類定義輸入輸出的二進制文件流對象,而應當用fstream類。