文本文件與二進制文件

本文轉載自查看原文 2017-09-12 00:00 1172 每天一筆

計算機文件分為兩類：文本文件和二進制文件。

一、相關定義

　　特別的是，文本文件是指以ASCII碼方式(也稱文本方式)存儲的文件，更確切地說，英文、數字等字符存儲的是ASCII碼，而漢字存儲的是機內碼。文本文件中除了存儲文件有效字符信息（包括能用ASCII碼字符表示的回車、換行等信息）外，不能存儲其他任何信息。

　　文本文件是一種由若干行字符構成的計算機文件。文本文件存在於計算機文件系統中。通常，通過在文本文件最后一行后放置文件結束標志來指明文件的結束。

　　文本文件是指一種容器，而純文本是指一種內容。文本文件可以包含純文本。

　　一般來說，計算機文件可以分為兩類：文本文件和二進制文件。

　　大家都知道計算機的存儲在物理上是二進制的，所以文本文件與二進制文件的區別並不是物理上的，而是邏輯上的。這兩者只是在編碼層次上有差異。簡單來說，文本文件是基於字符編碼的文件，常見的編碼有ASCII編碼，UNICODE編碼等等。二進制文件是基於值編碼的文件，你可以根據具體應用，指定某個值是什么意思（這樣一個過程，可以看作是自定義編碼。

　　從上面可以看出文本文件基本上是定長編碼的(也有非定長的編碼如UTF-8)。而二進制文件可看成是變長編碼的，因為是值編碼嘛，多少個比特代表一個值，完全由你決定。大家可能對BMP文件比較熟悉，就拿它舉例子吧，其頭部是較為固定長度的文件頭信息，前2字節用來記錄文件為BMP格式，接下來的8個字節用來記錄文件長度，再接下來的4字節用來記錄bmp文件頭的長度。

二、兩者的區別

要弄明白二者的區別，需要知道文件的讀寫過程。

讀文件：實際上是“磁盤→文件緩沖區→應用程序內存空間”這兩個轉化過程！

我們說“文本文件和二進制文件沒有區別”，實際上針對的是第一個過程；既然沒有區別，那么打開方式不同，為何顯示內容就不同呢？這個區別實際上是第二個過程造成的。

文件實際上包括兩部分，控制信息和內容信息。純文本文件僅僅是沒有控制格式信息罷了；實際上也是一種特殊的二進制文件。所以，我們很難區分二者的不同，因為他們的概念上不是完全互斥的。

我們說文本文件是特殊的二進制文件，是因為文本文件實際上的解釋格式已經確定了：ASCII或者unicode編碼。文本文件的一個缺點是，它的熵往往較低，也就是說，其實本可以用更小的存儲空間記錄這些信息。比如，文本文件中的一個數字65536，需要用5個字節來存儲；但是用二進制格式，采用int存儲，僅僅需要2個字節。而二進制文件elf和bmp等，都往往有一個head，告訴你文件信息和解釋方式。

至於“文本文件可以按行操作，即一行一行的操作，而二進制就只能按字節塊了”，這個說法則是完全錯誤的。

三、文本文件和二進制文件在存儲時的區別

二進制文件是把內存中的數據按其在內存中的存儲形式原樣輸出到磁盤上存放，也就是說存放的是數據的原形式。
文本文件是把數據的終端形式的二進制數據輸出到磁盤上存放，也就是說存放的是數據的終端形式。

　　我們有必要把需要存儲的數據分為字符數據和非字符數據兩類。當你有數據要存儲的時候．首先要考慮的問題並不是你要選擇用二進制文件還是文本文件來進行存儲，而是首先得考慮你要存儲的數據是字符數據還是非字符數據．在此基礎上再討論應該選擇用什么文件進行存儲為好。

（1）如果要存儲字符數據，無論是放在文本文件還是放在二進制文件中都和內存中的數據形式是沒有區別的．同樣也和終端形式沒有區別。那么在存儲和顯示的特性上也沒有任何區別，不浪費存儲空間也不浪費轉換時間。所以如果一個文件只存放字符數據，那么討論該文件是用文本文件或是二進制文件是沒有任何意義的。

（2）如果要存儲非字符數據，則情況要復雜一些。

如果您需要頻繁地保存和訪問數據．那么應該采用二進制文件進行存放，這樣可以節省存儲空間和轉換時間。
如果您需要頻繁地向終端顯示數據或從終端讀人數據，那么應該采用文本文件進行存放，這樣可以節省轉換時間。

（3）如果要存儲的數據中既有字符數據又有非字符數據那么要怎么辦呢?那就要綜合上述兩點進行權衡以找到最佳平衡點了

　　總結：字符數據本身在內存中就經過了編碼，所以無論是二進制還是文本形式都是一樣的，而對於非字符數據來說，例如inti=10；如果用二進制來進行存儲的話為1010，但是如果需要用文本形式來進行存儲的話就必須進行格式化編碼（對1和0分別編碼，即形式為‘1’和‘0’分別對應的碼值）。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 文本文件與二進制文件文本文件與二進制文件區別文本文件和二進制文件文本文件和二進制文件的區別 delphi 文件的讀取（二進制文件和文本文件）二進制文件和文本文件的讀寫文本文件和二進制文件的差異和區別 PHP-二進制文件和文本文件的區別【轉】淺談二進制文件讀寫和文本文件讀寫的區別 linux怎么區別文本文件和二進制文件