mysql中PK和UK分別是unique key 和primary key,兩種有些區別:
主鍵值必須是唯一且非空的;唯一鍵必須唯一但是可以為空。
=======================================================================================================================
select id,name where name=‘shenjian’
select id,name,sex where name=‘shenjian’
多查詢了一個屬性,為何檢索過程完全不同?
什么是回表查詢?
什么是索引覆蓋?
如何實現索引覆蓋?
哪些場景,可以利用索引覆蓋來優化SQL?
這些,這是今天要分享的內容。
畫外音:本文試驗基於MySQL5.6-InnoDB。
一、什么是回表查詢?
這先要從InnoDB的索引實現說起,InnoDB有兩大類索引:
聚集索引(clustered index)
普通索引(secondary index)
**InnoDB聚集索引和普通索引有什么差異? **
InnoDB 聚集索引 的葉子節點存儲行記錄,因此, InnoDB必須要有,且只有一個聚集索引:
(1)如果表定義了PK,則PK就是聚集索引;
(2)如果表沒有定義PK,則第一個not NULL unique列是聚集索引;
(3)否則,InnoDB會創建一個隱藏的row-id作為聚集索引;
畫外音:所以PK查詢非常快,直接定位行記錄。
InnoDB 普通索引 的葉子節點存儲主鍵值。
畫外音:注意,不是存儲行記錄頭指針,MyISAM的索引葉子節點存儲記錄指針。
舉個栗子,不妨設有表:
t(id PK, name KEY, sex, flag);
畫外音:id是聚集索引,name是普通索引。
表中有四條記錄:
1, shenjian, m, A
3, zhangsan, m, A
5, lisi, m, A
9, wangwu, f, B
兩個B+樹索引分別如上圖:
(1)id為PK,聚集索引,葉子節點存儲行記錄;
(2)name為KEY,普通索引,葉子節點存儲PK值,即id;
既然從普通索引無法直接定位行記錄,那 普通索引的查詢過程是怎么樣的呢?
通常情況下,需要掃碼兩遍索引樹。
例如:
select * from t where name=‘lisi’;
是如何執行的呢?
如 粉紅色 路徑,需要掃碼兩遍索引樹:
(1)先通過普通索引定位到主鍵值id=5;
(2)在通過聚集索引定位到行記錄;
這就是所謂的 回表查詢 ,先定位主鍵值,再定位行記錄,它的性能較掃一遍索引樹更低。
二、什么是索引覆蓋 (Covering index) ?
額,樓主並沒有在MySQL的官網找到這個概念。
畫外音:治學嚴謹吧?
借用一下SQL-Server官網的說法。
MySQL官網,類似的說法出現在explain查詢計划優化章節,即explain的輸出結果Extra字段為Using index時,能夠觸發索引覆蓋。
不管是SQL-Server官網,還是MySQL官網,都表達了:只需要在一棵索引樹上就能獲取SQL所需的所有列數據,無需回表,速度更快。
三、如何實現索引覆蓋?
常見的方法是:將被查詢的字段,建立到聯合索引里去。
create table user (
id int primary key,
name varchar(20),
sex varchar(5),
index(name)
)engine=innodb;
第一個SQL語句:
select id,name from user where name=‘shenjian’;
能夠命中name索引,索引葉子節點存儲了主鍵id,通過name的索引樹即可獲取id和name,無需回表,符合索引覆蓋,效率較高。
畫外音,Extra:Using index。
第二個SQL語句:
select id,name,sex from user where name=‘shenjian’;
能夠命中name索引,索引葉子節點存儲了主鍵id,但sex字段必須回表查詢才能獲取到,不符合索引覆蓋,需要再次通過id值掃碼聚集索引獲取sex字段,效率會降低。
畫外音,Extra:Using index condition。
如果把(name)單列索引升級為聯合索引(name, sex)就不同了。
create table user (
id int primary key,
name varchar(20),
sex varchar(5),
index(name, sex)
)engine=innodb;
可以看到:
select id,name … where name=‘shenjian’;
select id,name,sex … where name=‘shenjian’;
都能夠命中索引覆蓋,無需回表。
畫外音,Extra:Using index。
四、哪些場景可以利用索引覆蓋來優化SQL?
場景1:全表count查詢優化
原表為:
user(PK id, name, sex);
直接:
select count(name) from user;
不能利用索引覆蓋。
添加索引:
alter table user add key(name);
就能夠利用索引覆蓋提效。
場景2:列查詢回表優化
select id,name,sex … where name=‘shenjian’;
這個例子不再贅述,將單列索引(name)升級為聯合索引(name, sex),即可避免回表。
場景3:分頁查詢
select id,name,sex … order by name limit 500,100;
將單列索引(name)升級為聯合索引(name, sex),也可以避免回表。
InnoDB聚集索引普通索引 , 回表 , 索引覆蓋 ,希望這1分鍾大家有收獲。
提示,如果你不清楚explain結果Extra字段為Using index的含義,請閱讀前序文章:《如何利用工具,迅猛定位低效SQL?》