延遲關聯
-
能夠建立索引的種類分為主鍵索引、唯一索引、普通索引三種,
-
覆蓋索引只是一種查詢的一種效果,利用覆蓋索引來進行查詢操作,避免回表。用 explain 的結果,extra 列會出現:using index。
-
利用延遲關聯或者子查詢優化超多分頁場景。
說明:MySQL 並不是跳過 offset 行,而是取 offset+N 行,然后返回放棄前 offset 行,返回 N 行,那當
offset 特別大的時候,效率就非常的低下,要么控制返回的總頁數,要么對超過特定閾值的頁數進行 SQL
改寫。
正例:先快速定位需要獲取的 id 段,然后再關聯:
SELECT a.* FROM 表 1 a, (select id from 表 1 where 條件 LIMIT 100000,20 ) b where a.id=b.id
- 覆蓋 索引 必須 要 存儲 索引 列 的 值,假設 索引 覆蓋 了 WHERE 條件 中的 字段, 但不 是 整個 查詢 涉及 的 字段。 如果 條件 為 假( false), MySQL 5. 5 和 更早 的 版本 也 總是 會 回 表 獲取 數據 行, 盡管 並不 需要 這 一行 且 最終 會被 過 濾掉。
使用延遲關聯和覆蓋索引對查詢進行優化
- 測試結果來自 高性能MySQL
- 查詢 返回 了 一個 很大 的 結果 集, 因此 看不 到 優化 的 效果。 大部分 時間 都 花在 讀取 和 發送 數據 上了。
- 經過 索引 過濾, 過濾后 的 結果集 已經很少了,所以 優化效果 明顯
- 子 查詢 效率 反而 下降 因為 索引 過濾 時 符合 第一個 條件 的 結果 集 已經 很小, 所以 子 查詢 帶來 的 成本 反而 比 從 表中 直接 提取 完整 行 更高。
- 當從一個數據集中過濾出很少的結果集時,優化效果顯著。當數據集過濾出很多結果集、優化效果一般,數據集本身很少時,優化效果反而下降
SQL 性能優化的目標:至少要達到 range 級別,要求是 ref 級別,如果可以是consts 最好。
- 摘自阿里Java開發規約
- consts 單表中最多只有一個匹配行(主鍵或者唯一索引),在優化階段即可讀取到數據。
- ref 指的是使用普通的索引(normal index)。
- range 對索引進行范圍檢索。
反例:explain 表的結果,type=index,索引物理文件全掃描,速度非常慢,這個 index 級別比較 range還低,與全表掃描是小巫見大巫
【推薦】建組合索引的時候,區分度最高的在最左邊。
正例:如果 where a=? and b=? ,如果 a 列的幾乎接近於唯一值,那么只需要單建 idx_a 索引即可。
說明:存在非等號和等號混合時,在建索引時,請把等號條件的列前置。
如:where c>? and d=? 那么即使 c 的區分度更高,也必須把 d 放在索引的最前列,即索引 idx_d_c。
【強制】在 varchar 字段上建立索引時,必須指定索引長度,沒必要對全字段建立索引,根據實際文本區分度決定索引長度即可。
說明:索引的長度與區分度是一對矛盾體,一般對字符串類型數據,長度為 20 的索引,區分度會高達
90%以上,可以使用 count(distinct left(列名, 索引長度))/count(*)的區分度來確定。
【強制】頁面搜索嚴禁左模糊或者全模糊,如果需要請走搜索引擎來解決。
說明:索引文件具有 B-Tree 的最左前綴匹配特性,如果左邊的值未確定,那么無法使用此索引。
【推薦】如果有 order by 的場景,請注意利用索引的有序性。order by 最后的字段是組合索引的一部分,並且放在索引組合順序的最后,避免出現 file_sort 的情況,影響查詢性能。
正例:where a=? and b=? order by c; 索引:a_b_c
反例:索引如果存在范圍查詢,那么索引有序性無法利用,如:WHERE a>10 ORDER BY b; 索引 a_b 無法排序
施瓦茨(Baron Schwartz); 扎伊采夫(Peter Zaitsev); 特卡琴科(Vadim Tkachenko). 高性能MySQL(第3版)(博文視點圖書) (Kindle位置4126). 電子工業出版社. Kindle 版本.