Mysql--查詢的成本如何計算

本文轉載自查看原文 2020-11-10 13:58 729 Mysql

基於成本的優化步驟

1.在一條單表查詢語句真正執行之前，MySQL的查詢優化器會找出執行該語句所有可能使用的方案，對比之后找出成本最低的方案--這個成本最低的方案就是所謂的執行計划
2.具體流程如下：
3.根據搜索條件，找出所有可能使用的索引
4.計算全表掃描的代價
5.計算使用不同索引執行查詢的代價
6.對比各種執行方案的代價，找出成本最低的那一個

根據搜索條件，找出所有可能使用的索引

計算全表掃描的代價

1.聚簇索引占用的頁面數
2.該表中的記錄數
3.MySQL為每個表維護了一系列的統計信息,上述1和2的信息就在這里面。
4.可以通過SHOW TABLE STATUS LIKE tableName 來查詢
5.Rows代表記錄--在innodb下只是一個概數。
6.Data_length--表示表占用的存儲空間字節數。
7.Data_length = 聚簇索引的頁面數量 x 每個頁面的大小（16KB）
8.I/O成本==頁面數量*1.0+1.1
9.CPU成本=ROWS*0.2+1.0--0.2指的是訪問一條記錄所需的成本常數
10.總成本=I/O成本+CPU成本。
11.我們前邊說過表中的記錄其實都存儲在聚簇索引對應B+樹的葉子節點中，所以只要我們通過根節點獲得了最左邊的葉子節點，就可以沿着葉子節點組成的雙向鏈表把所有記錄都查看一遍
。也就是說全表掃描這個過程其實有的B+樹內節點是不需要訪問的.上述計算全表掃描是個比較粗略的計算。

計算使用不同索引執行查詢的代價

1.要分別分析單獨使用這些索引執行查詢的成本，最后還要分析是否可能使用到索引合並
2.MySQL查詢優化器先分析使用唯一二級索引的成本，再分析使用普通索引的成本---當然這個前提是無法直接走主鍵索引。
3.對於使用二級索引 + 回表方式的查詢：主要考慮范圍區間數量和需要回表的記錄數。
4.范圍區間數量：不論某個范圍區間的二級索引到底占用了多少頁面，查詢優化器粗暴的認為讀取索引的一個范圍區間的I/O成本和讀取一個頁面是相同的
5.需要回表的記錄數:首先通過左右區間可以在常數范圍找到臨界點記錄。然后只要從區間最左記錄沿着鏈表方向走向區間最右記錄。如果兩者相隔不超過10個頁面
是可以得到回表的准確數據。如果超過則統計10個頁面情況下平均每個頁面包含的記錄數，然后再乘以頁面個數。
6.尋找頁面數，只要去記錄也得父層尋找即可。
7.CPU成本主要是讀取二級索引記錄的成本 + 讀取並檢測回表后聚簇索引記錄的成本

index dive

mysql為索引的統計數據

1.MySQL也會為表中的每一個索引維護一份統計數據---- SHOW INDEX FROM TABLENAME
2.關鍵的屬性：Cardinality，Sub_part
3.Cardinality：表示索引列中不重復值的個數，這是一個估數。值越大代表該列重復值越少。值越大重復越小，則可區分度就很大，進而建立索引的意義不大。
4.Sub_part：對於存儲字符串或者字節串的列來說，有時候我們只想對這些串的前n個字符或字節建立索引，這個屬性表示的就是那個n值。如果對完整的列建立索引的話，該屬性的值就是NULL。

Condition filtering

兩表連接的成本分析

多表連接的成本分析

調節成本常數

作者：簡書徐小耳
鏈接：https://www.jianshu.com/p/aecdcc2babdd
來源：簡書
著作權歸作者所有。商業轉載請聯系作者獲得授權，非商業轉載請注明出處。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MySQL--當查詢遇到隱藏字符數據庫MySQL--條件查詢/排序查詢 MySQL--分組數據 MySQL--詳細查詢操作(單表記錄查詢、多表記錄查詢(連表查詢)、子查詢) mysql--之mysql在linux上的安裝 MySQL--查看內存信息期權成本計算 mysql--使用shardingsphere實現分表 mysql--學生課程成績表 MYSQL--表分區、查看分區(轉)