什么是索引覆蓋，強力推薦

本文轉載自查看原文 2019-11-24 17:21 300 數據庫/ SQL

一、什么是回表查詢？

innodb數據存儲方式

　　首先InnoDB在組織數據時，采用的方式是索引組織表，表中的數據時按照主鍵順序進行存放的，然后再按照主鍵生成一棵B+Tree，然后在葉子節點中存儲整張表的數據以及索引值。

INNOSB索引類型　

　　這先要從InnoDB的索引實現說起，InnoDB有兩大類索引：

- 　　聚集索引(clustered index)
- 　　普通索引(secondary index)

InnoDB聚集索引和普通索引有什么差異？

　　InnoDB 聚集索引 的葉子節點存儲行記錄，因此， InnoDB必須要有，且只有一個聚集索引：

　　　　（1）如果表定義了PK，則PK就是聚集索引；

　　　　（2）如果表沒有定義PK，則第一個not NULL unique列是聚集索引；

　　　　（3）否則，InnoDB會創建一個隱藏的row-id作為聚集索引；

　　InnoDB 普通索引 的葉子節點存儲主鍵值。

　　　　畫外音：注意，不是存儲行記錄頭指針，MyISAM的索引葉子節點存儲記錄指針。

舉個栗子，不妨設有表：

　　t(id PK, name KEY, sex, flag);

　　畫外音：id是聚集索引，name是普通索引。

表中有四條記錄：

1, shenjian, m, A
3, zhangsan, m, A
5, lisi, m, A
9, wangwu, f, B

數據儲存圖如下：

兩個B+樹索引分別如上圖：

　　（1）id為PK，聚集索引，葉子節點存儲行記錄；

　　（2）name為KEY，普通索引，葉子節點存儲PK值，即id；

既然從普通索引無法直接定位行記錄，那 普通索引的查詢過程是怎么樣的呢？

　　通常情況下，需要掃碼兩遍索引樹。

　　例如：select * from t where name=‘lisi’; 是如何執行的呢？

　　如 粉紅色 路徑，需要掃碼兩遍索引樹：

　　　　（1）先通過普通索引定位到主鍵值id=5；

　　　　（2）在通過聚集索引定位到行記錄；

　　這就是所謂的 回表查詢 ，先定位主鍵值，再定位行記錄，它的性能較掃一遍索引樹更低。

二、什么是索引覆蓋 (Covering index) ？

借用一下SQL-Server官網的說法。

　　MySQL官網，類似的說法出現在explain查詢計划優化章節，即explain的輸出結果Extra字段為Using index時，能夠觸發索引覆蓋。

　　不管是SQL-Server官網，還是MySQL官網，都表達了：只需要在一棵索引樹上就能獲取SQL所需的所有列數據，無需回表，速度更快。

三、如何實現索引覆蓋？

常見的方法是：將被查詢的字段，建立到聯合索引里去。

以下引用《迅猛定位低效SQL？》中的例子１：

create table user (
　　id int primary key,
　　name varchar(20),
　　sex varchar(5),
　　index(name)
)engine=innodb;

　　（１）第一個SQL語句：select id,name from user where name=‘shenjian’;

　　以上列子能夠命中name索引，索引葉子節點存儲了主鍵id，通過name的索引樹即可獲取id和name，無需回表，符合索引覆蓋，效率較高。

　　畫外音，Extra：Using index。

　（２）第二個SQL語句：select id,name,sex from user where name=‘shenjian’;

　　第二個SQL語句能夠命中name索引，索引葉子節點存儲了主鍵id，但sex字段必須回表查詢才能獲取到，不符合索引覆蓋，需要再次通過id值掃碼聚集索引獲取sex字段，效率會降低。

　　畫外音，Extra：Using index condition。

例子２：如果把(name)單列索引升級為聯合索引(name, sex)就不同了。

create table user (
　　id int primary key,
　　name varchar(20),
　　sex varchar(5),
　　index(name, sex)
)engine=innodb;

select id,name … where name=‘shenjian’;

select id,name,sex … where name=‘shenjian’;

　　從圖中可以看出，以上兩條語句都能夠命中索引覆蓋，無需回表。

　　畫外音，Extra：Using index。

四、哪些場景可以利用索引覆蓋來優化SQL？

場景1：全表count查詢優化

　　原表為：user(PK id, name, sex)；

　　直接：select count(name) from user;不能利用索引覆蓋。　

　　添加索引：alter table user add key(name);就能夠利用索引覆蓋提效。

場景2：列查詢回表優化

　　select id,name,sex … where name=‘shenjian’;

　　這個例子不再贅述，將單列索引(name)升級為聯合索引(name, sex)，即可避免回表。

場景3：分頁查詢

　　select id,name,sex … order by name limit 500,100;

　　將單列索引(name)升級為聯合索引(name, sex)，也可以避免回表。

提示，如果你不清楚explain結果Extra字段為Using index的含義，請閱讀前序文章：《如何利用工具，迅猛定位低效SQL？》

文章來源　http://www.yanwenbo.cn/topic/5d3d4eba66d5ab5381142605

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。