char char是定長的,也就是當你輸入的字符小於你指定的數目時,char(8),你輸入的字符小於8時,它會再后面補空值。當你輸入的字符大於指定的數時,它會截取超出的字符。 nvarchar(n) 包含 n 個字符的可變長度 Unicode 字符數據。n 的值必須介於 1 與 4,000 之間。字節的存儲大小是所輸入字符個數的兩倍。所輸入的數據字符長度可以為零。 varchar[(n)] 長度為 n 個字節的可變長度且非 Unicode 的字符數據。n 必須是一個介於 1 和 8,000 之間的數值。存儲大小為輸入數據的字節的實際長度,而不是 n 個字節。所輸入的數據字符長度可以為零。 1、CHAR。CHAR存儲定長數據很方便,CHAR字段上的索引效率級高,比如定義char(10),那么不論你存儲的數據是否達到了10個字節,都要占去10個字節的空間。
2、VARCHAR。存儲變長數據,但存儲效率沒有CHAR高。如果一個字段可能的值是不固定長度的,我們只知道它不可能超過10個字符,把它定義為 VARCHAR(10)是最合算的。VARCHAR類型的實際長度是它的值的實際長度+1。為什么“+1”呢?這一個字節用於保存實際使用了多大的長度。 從空間上考慮,用varchar合適;從效率上考慮,用char合適,關鍵是根據實際情況找到權衡點。 3、TEXT。text存儲可變長度的非Unicode數據,最大長度為2^31-1(2,147,483,647)個字符。 4、NCHAR、NVARCHAR、NTEXT。這三種從名字上看比前面三種多了個“N”。它表示存儲的是Unicode數據類型的字符。我們知道字符中,英文字符只需要一個字節存儲就足夠了,但漢字眾多,需要兩個字節存儲,英文與漢字同時存在時容易造成混亂,Unicode字符集就是為了解決字符集這種不兼容的問題而產生的,它所有的字符都用兩個字節表示,即英文字符也是用兩個字節表示。nchar、nvarchar的長度是在1到4000之間。和char、varchar比較起來,nchar、nvarchar則最多存儲4000個字符,不論是英文還是漢字;而char、varchar最多能存儲8000個英文,4000個漢字。可以看出使用nchar、nvarchar數據類型時不用擔心輸入的字符是英文還是漢字,較為方便,但在存儲英文時數量上有些損失。
所以一般來說,如果含有中文字符,用nchar/nvarchar,如果純英文和數字,用char/varchar。
1. char
固定長度,最長n個字符。
2. varchar
最大長度為n的可變字符串。
(n為某一整數,不同數據庫,最大長度n不同)
char和varchar區別:
varchar必char節省空間,但在效率上比char稍微差一些。
說varchar比char節省空間,是因為varchar是可變字符串,比如:用varchar(5)存儲字符串“abc”,只占用3個字節的存儲空間,而用char(5)存儲,則占用5個字節(“abc ”)。
說varchar比char效率稍差,是因為,當修改varchar數據時,可能因為數據長度不同,導致數據遷移(即:多余I/O)。其中,oracle對此多余I/O描述的表達是:“行遷移”(Row Migration)。
“行遷移”(Row Migration):
“當一行的記錄初始插入時是可以存儲在一個block中的,由於更新操作導致行增加了,而block的自由空間已經完全滿了,這個時候就產生了行遷移。在這種情況下,oracle將會把整行數據遷移到一個新的block中,oracle會保留被遷移的行的原始指針指向新的存放行數據的block,這就意味着被遷移行的ROW ID是不會改變的。"
其中要解釋一下:block是oracle中最小的數據組織與管理單位,是數據文件磁盤儲存空間單位,也是
數據庫I/O最小單位(
也就是說,讀和寫都是一個block打大小,所以如果block沒滿時,更新內容長度變更的varchar字段,和更新內容長度沒變的varchar字段,I/O次數是一樣,不存在額外消耗,只有在block滿時,才會出現額外I/O,所以char和varchar性能之間的性能差異,是相當細微的,絕大多數情況下可以忽略不計,所以上文描述的“稍”差的含義)
。
所以,我的開發經驗是:“
用varchar完全代替char吧,沒什么好顧慮的
”。
3. nvarchar
nvarchar的特性,需要和varchar對比。
nvarchar和varchar的不同主要是在對於數據的存儲方式上:
1). varchar:
按字節存儲
數據
varchar(6),最多能存儲6個字節的數據,比如:
“哈哈哈”,“abcdef”......
備注:一個中文字符在數據庫里占多少個字節,要看unicode的編碼方式,比如:utf8在mysql上占3個字節,sqlserver的Chinese_PRC_CI_AS占2個字節...
2). nvarchar:
按字符存儲數據
nvarchar(6),最多能存儲6個字符/中文數據,比如:"哈哈哈哈哈哈",“abcdef”......
nvarchar(m)最大存儲的實際字節長度=n*m(n跟據編碼方式而定),如果nvarchar存儲的是英文字符,也是根據編碼方式存儲n的字節長度。也就是說,如果
用nvarchar存儲英文字符,會浪費一半以上的存儲空間....
總結:
1. char和varchar的性能差距是很小的,可以考慮忽略不計。
2. 在大數據量應用中,使用char和nvarchar有可能導致大量的存儲空間的浪費。