一、varchar設置為索引時的影響
MySQL建立索引時假設沒有限制索引的大小,索引長度會默認采用該字段的長度。
也就是說varchar(20)和varchar(255)相應的索引長度分別為:20*3 + 2 + 1,255*3 + 2 + 1。當中"+2"用來存儲長度信息,“+1”用來標記是否為空。
載入索引信息時用varchar(255)類型會占用很多其它的內存; (備注:當字段定義為非空的時候。是否為空的標記將不占用字節)
CREATE DATABASE TestDataBase USE TestDataBase CREATE TABLE ABC ( `id` int(11) DEFAULT NULL, `name` varchar(20) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8 ALTER TABLE `ABC` ADD INDEX `nameIndex` (`name`) explain select name from ABC alter table ABC modify name varchar(255) explain select name from ABC
結果中的key_len表示索引使用的字節數,根據這個值可以判斷索引的使用情況,特別是在組合索引的時候,判斷該索引有多少部分被使用到非常重要。
在計算key_len時,下面是一些需要考慮的點:
-
索引字段的附加信息:可以分為變長和定長數據類型討論,當索引字段為定長數據類型時,如char,int,datetime,需要有是否為空的標記,這個標記占用1個字節(對於not null的字段來說,則不需要這1字節);對於變長數據類型,比如varchar,除了是否為空的標記外,還需要有長度信息,需要占用兩個字節。
-
對於,char、varchar、blob、text等字符集來說,key len的長度還和字符集有關,latin1一個字符占用1個字節,gbk一個字符占用2個字節,utf8一個字符占用3個字節。
綜上,下面來看一些例子:
列類型 | KEY_LEN | 備注 |
---|---|---|
id int | key_len = 4+1 | int為4bytes,允許為NULL,加1byte |
id bigint not null | key_len=8 | bigint為8bytes |
user char(30) utf8 | key_len=30*3+1 | utf8每個字符為3bytes,允許為NULL,加1byte |
user varchar(30) not null utf8 | key_len=30*3+2 | utf8每個字符為3bytes,變長數據類型,加2bytes |
user varchar(30) utf8 | key_len=30*3+2+1 | utf8每個字符為3bytes,允許為NULL,加1byte,變長數據類型,加2bytes |
detail text(10) utf8 | key_len=30*3+2+1 | TEXT截取部分,被視為動態列類型。 |
備注:key_len只指示了where中用於條件過濾時被選中的索引列,是不包含order by/group by這一部分被選中的索引列的。
例如,有個聯合索引idx(c1,c2,c3),3列均是int not null,那么下面的SQL執行計划中,key_len的值是8而不是12:
二、varchar(20)與varchar(255)都是保持可變的字符串,當使用ROW_FORMAT=FIXED創建MyISAM表時,會為每行使用固定的長度空間,這樣設置不同的varchar長度值時。存儲相同數據所占用的空間是不一樣。
三、通常情況下使用varchar(20)和varchar(255)保持'hello'占用的空間都是一樣的,但使用長度較短的列卻有巨大的優勢。較大的列使用很多其它的內存。由於MySQL一般會分配固定大小的內存塊來保存值,這對排序或使用基於內存的暫時表尤其不好。相同的事情也會發生在使用文件排序或者基於磁盤的暫時表的時候。