數據庫中char, varchar, nvarchar的差異


char     char是定長的,也就是當你輸入的字符小於你指定的數目時,char(8),你輸入的字符小於8時,它會再后面補空值。當你輸入的字符大於指定的數時,它會截取超出的字符。    nvarchar(n)     包含 n 個字符的可變長度 Unicode 字符數據。n 的值必須介於 1 與 4,000 之間。字節的存儲大小是所輸入字符個數的兩倍。所輸入的數據字符長度可以為零。        varchar[(n)]       長度為 n 個字節的可變長度且非 Unicode 的字符數據。n 必須是一個介於 1 和 8,000 之間的數值。存儲大小為輸入數據的字節的實際長度,而不是 n 個字節。所輸入的數據字符長度可以為零。 1、CHAR。CHAR存儲定長數據很方便,CHAR字段上的索引效率級高,比如定義char(10),那么不論你存儲的數據是否達到了10個字節,都要占去10個字節的空間。 

 2、VARCHAR。存儲變長數據,但存儲效率沒有CHAR高。如果一個字段可能的值是不固定長度的,我們只知道它不可能超過10個字符,把它定義為 VARCHAR(10)是最合算的。VARCHAR類型的實際長度是它的值的實際長度+1。為什么“+1”呢?這一個字節用於保存實際使用了多大的長度。   從空間上考慮,用varchar合適;從效率上考慮,用char合適,關鍵是根據實際情況找到權衡點。   3、TEXT。text存儲可變長度的非Unicode數據,最大長度為2^31-1(2,147,483,647)個字符。   4、NCHAR、NVARCHAR、NTEXT。這三種從名字上看比前面三種多了個“N”。它表示存儲的是Unicode數據類型的字符。我們知道字符中,英文字符只需要一個字節存儲就足夠了,但漢字眾多,需要兩個字節存儲,英文與漢字同時存在時容易造成混亂,Unicode字符集就是為了解決字符集這種不兼容的問題而產生的,它所有的字符都用兩個字節表示,即英文字符也是用兩個字節表示。nchar、nvarchar的長度是在1到4000之間。和char、varchar比較起來,nchar、nvarchar則最多存儲4000個字符,不論是英文還是漢字;而char、varchar最多能存儲8000個英文,4000個漢字。可以看出使用nchar、nvarchar數據類型時不用擔心輸入的字符是英文還是漢字,較為方便,但在存儲英文時數量上有些損失。  

所以一般來說,如果含有中文字符,用nchar/nvarchar,如果純英文和數字,用char/varchar。

 

1. char
     固定長度,最長n個字符。
 
2. varchar
     最大長度為n的可變字符串。
(n為某一整數,不同數據庫,最大長度n不同)
 
char和varchar區別:
     varchar必char節省空間,但在效率上比char稍微差一些。
     說varchar比char節省空間,是因為varchar是可變字符串,比如:用varchar(5)存儲字符串“abc”,只占用3個字節的存儲空間,而用char(5)存儲,則占用5個字節(“abc  ”)。
     說varchar比char效率稍差,是因為,當修改varchar數據時,可能因為數據長度不同,導致數據遷移(即:多余I/O)。其中,oracle對此多余I/O描述的表達是:“行遷移”(Row Migration)。
 
“行遷移”(Row Migration):
        “當一行的記錄初始插入時是可以存儲在一個block中的,由於更新操作導致行增加了,而block的自由空間已經完全滿了,這個時候就產生了行遷移。在這種情況下,oracle將會把整行數據遷移到一個新的block中,oracle會保留被遷移的行的原始指針指向新的存放行數據的block,這就意味着被遷移行的ROW ID是不會改變的。"
     其中要解釋一下:block是oracle中最小的數據組織與管理單位,是數據文件磁盤儲存空間單位,也是 數據庫I/O最小單位( 也就是說,讀和寫都是一個block打大小,所以如果block沒滿時,更新內容長度變更的varchar字段,和更新內容長度沒變的varchar字段,I/O次數是一樣,不存在額外消耗,只有在block滿時,才會出現額外I/O,所以char和varchar性能之間的性能差異,是相當細微的,絕大多數情況下可以忽略不計,所以上文描述的“稍”差的含義)
     所以,我的開發經驗是:“ 用varchar完全代替char吧,沒什么好顧慮的 ”。
 
3. nvarchar
     nvarchar的特性,需要和varchar對比。
     nvarchar和varchar的不同主要是在對於數據的存儲方式上:
     1). varchar: 按字節存儲 數據
          varchar(6),最多能存儲6個字節的數據,比如: “哈哈哈”,“abcdef”......
備注:一個中文字符在數據庫里占多少個字節,要看unicode的編碼方式,比如:utf8在mysql上占3個字節,sqlserver的Chinese_PRC_CI_AS占2個字節...
     2). nvarchar: 按字符存儲數據
          nvarchar(6),最多能存儲6個字符/中文數據,比如:"哈哈哈哈哈哈",“abcdef”......
          nvarchar(m)最大存儲的實際字節長度=n*m(n跟據編碼方式而定),如果nvarchar存儲的是英文字符,也是根據編碼方式存儲n的字節長度。也就是說,如果 用nvarchar存儲英文字符,會浪費一半以上的存儲空間....
          
總結:
      1. char和varchar的性能差距是很小的,可以考慮忽略不計。
     2. 在大數據量應用中,使用char和nvarchar有可能導致大量的存儲空間的浪費。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM