CSV (逗號分隔值文件格式)


逗號分隔值(Comma-Separated Values,CSV,有時也稱為字符分隔值,因為分隔字符也可以不是逗號),其文件以純文本形式存儲表格數據(數字和文本)。純文本意味着該文件是一個字符序列,不含必須像二進制數字那樣被解讀的數據。CSV文件由任意數目的記錄組成,記錄間以某種換行符分隔;每條記錄由字段組成,字段間的分隔符是其它字符或字符串,最常見的是逗號或制表符。通常,所有記錄都有完全相同的字段序列。通常都是純文本文件。建議使用WORDPAD或是記事本來開啟,再則先另存新檔后用EXCEL開啟,也是方法之一。
CSV文件格式的通用標准並不存在,但是在RFC 4180中有基礎性的描述。使用的字符編碼同樣沒有被指定,但是bitASCII是最基本的通用編碼。
用法:
CSV是一種通用的、相對簡單的文件格式,被用戶、商業和科學廣泛應用。最廣泛的應用是在程序之間轉移表格數據,而這些程序本身是在不兼容的格式上進行操作的(往往是私有的和/或無規范的格式)。因為大量程序都支持某種CSV變體,至少是作為一種可選擇的輸入/輸出格式。 [1] 
例如,一個用戶可能需要交換信息,從一個以私有格式存儲數據的數據庫程序,到一個數據格式完全不同的電子表格。最可能的情況是,該數據庫程序可以導出數據為“CSV”,然后被導出的CSV文件可以被電子表格程序導入。
“CSV”並不是一種單一的、定義明確的格式(盡管RFC 4180有一個被通常使用的定義)。因此在實踐中,術語“CSV”泛指具有以下特征的任何文件:
  1. 純文本,使用某個字符集,比如ASCIIUnicodeEBCDICGB2312
  2. 由記錄組成(典型的是每行一條記錄);
  3. 每條記錄被分隔符分隔為字段(典型分隔符有逗號、分號或制表符;有時分隔符可以包括可選的空格);
  4. 每條記錄都有同樣的字段序列。
在這些常規的約束條件下,存在着許多CSV變體,故CSV文件並不完全互通。然而,這些變異非常小,並且有許多應用程序允許用戶預覽文件(這是可行的,因為它是純文本),然后指定分隔符、轉義規則等。如果一個特定CSV文件的變異過大,超出了特定接收程序的支持范圍,那么可行的做法往往是人工檢查並編輯文件,或通過簡單的程序來修復問題。因此在實踐中,CSV文件還是非常方便的。
規則
1 開頭是不留空,以行為單位。
2 可含或不含列名,含列名則居文件第一行。
3 一行數據不跨行,無空行。
4 以半角逗號(即,)作分隔符,列為空也要表達其存在。
5列內容如存在半角引號(即"),替換成半角雙引號("")轉義,即用半角引號(即"")將該字段值包含起來。
6文件讀寫時引號,逗號操作規則互逆。
7內碼格式不限,可為 ASCII、Unicode 或者其他。
8不支持數字
9不支持特殊字符
 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM