源地址:http://www.cnblogs.com/iyangyuan/p/3491215.html
oracle數據庫相信大家都比較熟悉,數據庫中有一種非常常用的數據類型:字符串型。
對應該類型,在oracle中有三種比較常用的類型:varchar2(byte)、varchar2(char)、nvarchar2()。
那么這三種類型到底有什么區別呢?
首先,我們要時刻記清:無論是varchar2還是nvarchar2,最大字節數都是4000。
varchar2(byte):就是默認的表示方式,比如我們寫成:varchar2(100),就相當於varchar2(100 byte),表示最大字節數是100,該字段最多能容納100個字節,強調空間大小。由於我們描述的是字節,因此,保存漢字等字符時,就要小心了。如果你的數據庫用的是GBK編碼,那么一個漢字將占用2個字節,最多能存50個漢字,如果你的數據庫用的是UTF8編碼,那么一個漢字將占用3個字節,最多能存33個漢字。
varchar2(char):表示最大字符數是100,該字段最多能容納100個字符,強調個數。假設我們寫成varchar2(100 char),那么無論是數字、字母、漢字,都看成一個字符,最多寫100個,當然,漢字越多,占用的空間越大,同樣遵循上邊的數據庫編碼原則。例如:存入一個漢字,底層占2或3個字節,存入一個字母,占1個字節,絕對不是某些文章所說1個字母或數字也占2或3個字節!
nvarchar2():沒有byte、char之分,類似於varchar2(char),只不過nvarchar2()屏蔽了數據庫編碼,無論是何種編碼,nvarchar2()中一個漢字都占兩個字節。
一般的教程,也就到這了,可是如果再多一步思考,會發現一個致命問題。
實際應用中,很可能會出現這種寫法:varchar2(1400 char),我們主觀的認為,這個字段最長不能超過1400個字符,這意味着我們可能會存入1399個字符,貌似很正確的樣子。
但是,如果這1399個字符都是漢字,字符長度並沒有超過1400,看起來一切正常,但實際上我們損失了一部分數據,為什么?
因為1399個漢字,按UTF8編碼來說(99%的項目都是UTF8編碼吧。。),需要占用1399*3=4197個字節,而文章開篇就說,無論是什么char,最大長度就是4000字節,一個也不能多,因此多出來的197個字節,都會抹去,而整個過程中,無任何錯誤提示,你的數據就這樣蒸發了!
所以,對於GBK編碼的數據庫而言,安全的寫法為:varchar2(2000 char)、nvarchar2(2000),對於UTF8編碼的數據庫而言,安全的寫法為:varchar2(1333 char)、nvarchar2(2000)。
各位讀者,趕快檢查一下你的數據庫吧!
小菜水平有限,高手勿噴,歡迎與我交流~~~