組合索引的最左優先原則


MySQL數據庫,game_order表表結構如下,下面哪些sql能使用到索引?

這道題目考察的知識點是MySQL組合索引(復合索引)的最左優先原則。

最左前綴匹配原則

在mysql建立聯合索引時會遵循最左前綴匹配的原則,即最左優先,在檢索數據時從聯合索引的最左邊開始匹配,組合索引的第一個字段必須出現在查詢組句中,這個索引才會被用到,示例:
對列col1、列col2和列col3建一個聯合索引:

KEY test_col1_col2_col3 on test(col1,col2,col3);

聯合索引 test_col1_col2_col3 實際建立了(col1)、(col1,col2)、(col,col2,col3)三個索引。

上面這個查詢語句執行時會依照最左前綴匹配原則,檢索時會使用索引(col1,col2)進行數據匹配。

注意

索引的字段可以是任意順序的,如:

SELECT * FROM test WHERE col1=“1” AND clo2=“2”
SELECT * FROM test WHERE col2=“2” AND clo1=“1”

這兩個查詢語句都會用到索引(col1,col2),mysql創建聯合索引的規則是首先會對聯合合索引的最左邊的,也就是第一個字段col1的數據進行排序,在第一個字段的排序基礎上,然后再對后面第二個字段col2進行排序。其實就相當於實現了類似 order by col1 col2這樣一種排序規則。

所以題目會創建三個索引(plat_order_id)、(plat_order_id與plat_game_id的組合索引)、(plat_order_id、plat_game_id與plat_id的組合索引)。根據最左匹配原則,where語句必須要有plat_order_id才能調用索引(如果沒有plat_order_id字段那么一個索引也調用不到),如果同時出現plat_order_id與plat_game_id則會調用兩者的組合索引,如果同時出現三者則調用三者的組合索引。

思考

對於聯合索引(col1,col2,col3),查詢語句SELECT * FROM test WHERE col2=2;是否能夠觸發索引?

EXPLAIN SELECT * FROM test WHERE col2=2;
EXPLAIN SELECT * FROM test WHERE col1=1;

借助mysql查詢優化器explain,explain會糾正sql語句該以什么樣的順序執行效率最高,最后才生成真正的執行計划,觀察explain中上述兩個sql語句結果的type字段。查詢中分別是:

  • type: index
  • type: ref

index:這種類型表示mysql會對整個該索引進行掃描。要想用到這種類型的索引,對這個索引並無特別要求,只要是索引,或者某個聯合索引的一部分,mysql都可能會采用index類型的方式掃描。但是呢,缺點是效率不高,mysql會從索引中的第一個數據一個個的查找到最后一個數據,直到找到符合判斷條件的某個索引。所以,上述語句會觸發索引。
ref:這種類型表示mysql會根據特定的算法快速查找到某個符合條件的索引,而不是會對索引中每一個數據都進行一一的掃描判斷,也就是所謂平常理解的使用索引查詢會更快的取出數據。而要想實現這種查找,索引卻是有要求的,要實現這種能快速查找的算法,索引就要滿足特定的數據結構。簡單說,也就是索引字段的數據必須是有序的,才能實現這種類型的查找,才能利用到索引。

為什么要使用聯合索引

減少開銷。建一個聯合索引(col1,col2,col3),實際相當於建了(col1),(col1,col2),(col1,col2,col3)三個索引。每多一個索引,都會增加寫操作的開銷和磁盤空間的開銷。對於大量數據的表,使用聯合索引會大大的減少開銷!

覆蓋索引。對聯合索引(col1,col2,col3),如果有如下的sql: select col1,col2,col3 from test where col1=1 and col2=2。那么MySQL可以直接通過遍歷索引取得數據,而無需回表,這減少了很多的隨機io操作。減少io操作,特別的隨機io其實是dba主要的優化策略。所以,在真正的實際應用中,覆蓋索引是主要的提升性能的優化手段之一。

效率高。索引列越多,通過索引篩選出的數據越少。有1000W條數據的表,有如下sql:select from table where col1=1 and col2=2 and col3=3,假設假設每個條件可以篩選出10%的數據,如果只有單值索引,那么通過該索引能篩選出1000W10%=100w條數據,然后再回表從100w條數據中找到符合col2=2 and col3= 3的數據,然后再排序,再分頁;如果是聯合索引,通過索引篩選出1000w10% 10% *10%=1w,效率提升可想而知!


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM