什么是索引覆蓋,強力推薦


 

一、什么是回表查詢?

innodb數據存儲方式

  首先InnoDB在組織數據時,采用的方式是索引組織表,表中的數據時按照主鍵順序進行存放的,然后再按照主鍵生成一棵B+Tree,然后在葉子節點中存儲整張表的數據以及索引值。

INNOSB索引類型 

  這先要從InnoDB的索引實現說起,InnoDB有兩大類索引:

    •   聚集索引(clustered index)
    •   普通索引(secondary index)

InnoDB聚集索引和普通索引有什么差異? 

  InnoDB 聚集索引 的葉子節點存儲行記錄,因此, InnoDB必須要有,且只有一個聚集索引:

    (1)如果表定義了PK,則PK就是聚集索引;

    (2)如果表沒有定義PK,則第一個not NULL unique列是聚集索引;

    (3)否則,InnoDB會創建一個隱藏的row-id作為聚集索引;

  InnoDB 普通索引 的葉子節點存儲主鍵值。

    畫外音:注意,不是存儲行記錄頭指針,MyISAM的索引葉子節點存儲記錄指針。

舉個栗子,不妨設有表:

  t(id PK, name KEY, sex, flag);

  畫外音:id是聚集索引,name是普通索引。

表中有四條記錄:

1, shenjian, m, A
3, zhangsan, m, A
5, lisi, m, A
9, wangwu, f, B

數據儲存圖如下:

兩個B+樹索引分別如上圖:

  (1)id為PK,聚集索引,葉子節點存儲行記錄;

  (2)name為KEY,普通索引,葉子節點存儲PK值,即id;

 

既然從普通索引無法直接定位行記錄,那 普通索引的查詢過程是怎么樣的呢?

  通常情況下,需要掃碼兩遍索引樹。

  例如:select * from t where name=‘lisi’; 是如何執行的呢?

  如 粉紅色 路徑,需要掃碼兩遍索引樹:

    (1)先通過普通索引定位到主鍵值id=5;

    (2)在通過聚集索引定位到行記錄;

  這就是所謂的 回表查詢 ,先定位主鍵值,再定位行記錄,它的性能較掃一遍索引樹更低。

二、什么是索引覆蓋 (Covering index)

借用一下SQL-Server官網的說法。

  MySQL官網,類似的說法出現在explain查詢計划優化章節,即explain的輸出結果Extra字段為Using index時,能夠觸發索引覆蓋。

  不管是SQL-Server官網,還是MySQL官網,都表達了:只需要在一棵索引樹上就能獲取SQL所需的所有列數據,無需回表,速度更快。

 

三、如何實現索引覆蓋?

常見的方法是:將被查詢的字段,建立到聯合索引里去。

以下引用《迅猛定位低效SQL?》中的例子1:

create table user (
  id int primary key,
  name varchar(20),
  sex varchar(5),
  index(name)
)engine=innodb;

  (1)第一個SQL語句:select id,name from user where name=‘shenjian’;

  以上列子能夠命中name索引,索引葉子節點存儲了主鍵id,通過name的索引樹即可獲取id和name,無需回表,符合索引覆蓋,效率較高。

  畫外音,Extra:Using index。

 (2)第二個SQL語句:select id,name,sex from user where name=‘shenjian’;

  第二個SQL語句能夠命中name索引,索引葉子節點存儲了主鍵id,但sex字段必須回表查詢才能獲取到,不符合索引覆蓋,需要再次通過id值掃碼聚集索引獲取sex字段,效率會降低。

  畫外音,Extra:Using index condition。

 

例子2:如果把(name)單列索引升級為聯合索引(name, sex)就不同了。

create table user (
  id int primary key,
  name varchar(20),
  sex varchar(5),
  index(name, sex)
)engine=innodb;

select id,name … where name=‘shenjian’;

select id,name,sex … where name=‘shenjian’;

  從圖中可以看出,以上兩條語句都能夠命中索引覆蓋,無需回表。

  畫外音,Extra:Using index。

四、哪些場景可以利用索引覆蓋來優化SQL?

場景1:全表count查詢優化

  原表為:user(PK id, name, sex);

  直接:select count(name) from user;不能利用索引覆蓋。 

  添加索引:alter table user add key(name);就能夠利用索引覆蓋提效。

場景2:列查詢回表優化

  select id,name,sex … where name=‘shenjian’;

  這個例子不再贅述,將單列索引(name)升級為聯合索引(name, sex),即可避免回表。

場景3:分頁查詢

  select id,name,sex … order by name limit 500,100;

  將單列索引(name)升級為聯合索引(name, sex),也可以避免回表。

提示,如果你不清楚explain結果Extra字段為Using index的含義,請閱讀前序文章:《如何利用工具,迅猛定位低效SQL?

文章來源 http://www.yanwenbo.cn/topic/5d3d4eba66d5ab5381142605 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM