sql優化總結--博客
第一次自己寫博客,以后要堅持每掌握一個技能點,就要寫一篇博客出來,做一個不滿足於一個
只會寫if...else的程序員。
只會寫if...else的程序員。
最近三個月入職了一家新的公司,做的是CRM系統,將公司多個平台的數據同步到CRM,進行
查詢,統計和匯總。由於數據量比較龐大,大部分表數據上百萬,甚至有的表數據上千萬。所以
在系統中做sql優化比較多,特此寫一篇博客總結一下關於sql優化方面的經驗。
查詢,統計和匯總。由於數據量比較龐大,大部分表數據上百萬,甚至有的表數據上千萬。所以
在系統中做sql優化比較多,特此寫一篇博客總結一下關於sql優化方面的經驗。
--導致查詢緩慢的原因
1、數據量過大
1、數據量過大
2、表設計不合理
3、sql語句寫得不好
4、沒有合理使用索引
-- 針對SQL語句的優化
1、查詢語句中不要使用 *
2、盡量減少子查詢,使用關聯查詢(left join,right join,inner join)替代
3、減少使用IN或者NOT IN ,使用exists,not exists或者關聯查詢語句替代
4、or 的查詢盡量用 union或者union all 代替
(在確認沒有重復數據或者不用剔除重復數據時,union all會更好)
(在確認沒有重復數據或者不用剔除重復數據時,union all會更好)
5、合理的增加冗余的字段(減少表的聯接查詢)
6、增加中間表進行優化(這個主要是在統計報表的場景,
后台開定時任務將數據先統計好,盡量不要在查詢的時候去統計)
后台開定時任務將數據先統計好,盡量不要在查詢的時候去統計)
7、建表的時候能使用數字類型的字段就使用數字類型(type,status...),數字類型的字段作為條件查詢比字符串的快
8、那些可以過濾掉最大數量記錄的條件必須寫在WHERE子句的最末尾
-- 索引優化
如果針對sql語句已經沒啥可以優化的,那我們就要考慮加索引了。
--說索引前先說說explain查看sql的執行計划
1 id
SELECT識別符。這是select查詢序列號。這個不重要
SELECT識別符。這是select查詢序列號。這個不重要
2 select_type
表示查詢中每個select子句的類型(簡單OR復雜)
有以下幾種值:
1 simple
查詢中不包含查詢或者UNION(聯合查詢)
2 PRIMARY
查詢中若包含任何復雜的子部分,最外層查詢則被標記為:PRIMARY
3 UNION
表示連接查詢的第2個或后面的查詢語句。
4 DEPENDENT UNION
UNION 中的第二個或者后面的select語句,取決於外面的查詢
5 UNION RESULT
連接查詢的結果
6 SUBQUERY
子查詢中的第一個select語句
7 DEPENDENT SUBQUERY
子查詢中的第一個select語句,取決於外面的查詢
8 DERIVED
select(from子句的子查詢)
表示查詢中每個select子句的類型(簡單OR復雜)
有以下幾種值:
1 simple
查詢中不包含查詢或者UNION(聯合查詢)
2 PRIMARY
查詢中若包含任何復雜的子部分,最外層查詢則被標記為:PRIMARY
3 UNION
表示連接查詢的第2個或后面的查詢語句。
4 DEPENDENT UNION
UNION 中的第二個或者后面的select語句,取決於外面的查詢
5 UNION RESULT
連接查詢的結果
6 SUBQUERY
子查詢中的第一個select語句
7 DEPENDENT SUBQUERY
子查詢中的第一個select語句,取決於外面的查詢
8 DERIVED
select(from子句的子查詢)
3 table 表示查詢的表
4 type
表示表的連接類型
以下的連接類型的順序是從最佳類型到最差類型
1 syste
表僅有一行,這是const類型的特例,平時不會出現
2 const
數據表最多只有一個匹配行,因為只匹配一行數據,所以很快,常用於PRIMARY KEY
或者UNIQUE查詢,可理解為是最優化的。
3 eq_ref
mysql手冊是這樣說的: 對於每個來自前面的表的行組合,從該表中讀取一行。
這可能是最好的聯接類型,除了const類型。他用在一個索引的所有部分被聯接使用並且並且索引是UNIQUE或PRIMARY KEY eq_ref可以用於使用=比較帶索引的列。
表示表的連接類型
以下的連接類型的順序是從最佳類型到最差類型
1 syste
表僅有一行,這是const類型的特例,平時不會出現
2 const
數據表最多只有一個匹配行,因為只匹配一行數據,所以很快,常用於PRIMARY KEY
或者UNIQUE查詢,可理解為是最優化的。
3 eq_ref
mysql手冊是這樣說的: 對於每個來自前面的表的行組合,從該表中讀取一行。
這可能是最好的聯接類型,除了const類型。他用在一個索引的所有部分被聯接使用並且並且索引是UNIQUE或PRIMARY KEY eq_ref可以用於使用=比較帶索引的列。
4 ref
查詢條件索引既不是UNIQUE 也不是PRIMARY KEY 的情況,ref可用於=或<或>操作符的帶索引的列。
查詢條件索引既不是UNIQUE 也不是PRIMARY KEY 的情況,ref可用於=或<或>操作符的帶索引的列。
5 ref_or_null
該聯接類型如同ref,但是添加了Mysql可以專門搜索包含null值的行,在解決子查詢中經常使用該聯接類型的優化。
該聯接類型如同ref,但是添加了Mysql可以專門搜索包含null值的行,在解決子查詢中經常使用該聯接類型的優化。
以上這五種情況都是很理想的索引使用情況。
6 index
該連接類型與ALL相同,除了只有索引樹被掃描。這通常比ALL快,因為索引文件通常比數據文件小。
該連接類型與ALL相同,除了只有索引樹被掃描。這通常比ALL快,因為索引文件通常比數據文件小。
7 ALL
對於每個來自先前的表的行組合,進行完整的表掃描。
對於每個來自先前的表的行組合,進行完整的表掃描。
5 possible_key
指出Mysql能使用哪個索引在該表中找到行。
如果該列為NULL 說明沒有使用索引,可以對該列創建索引來提高性能
6 Key
顯示mysql實際決定使用的索引,如果沒有選擇索引,鍵是null
可以強制使用索引或者忽略索引:
強制使用索引:USE index(列名)
忽略使用索引:IGNORE INDEX(列名)
7 key_len
顯示mysql決定使用的鍵長度。如果鍵是NULL則長度為NULL。
注意:key_len 是確定了mysql將實際使用的索引長度
指出Mysql能使用哪個索引在該表中找到行。
如果該列為NULL 說明沒有使用索引,可以對該列創建索引來提高性能
6 Key
顯示mysql實際決定使用的索引,如果沒有選擇索引,鍵是null
可以強制使用索引或者忽略索引:
強制使用索引:USE index(列名)
忽略使用索引:IGNORE INDEX(列名)
7 key_len
顯示mysql決定使用的鍵長度。如果鍵是NULL則長度為NULL。
注意:key_len 是確定了mysql將實際使用的索引長度
8 ref
顯示使用哪個列或常數與key一起從表中選擇行
9 rows
顯示mysql認為它執行查詢時必須檢查的行數
10 extra
關於MYSQL如何解析查詢的額外信息。Using temporary和Using filesort,意思MYSQL根本不能使用索引,結果是檢索會很慢
說明:extra列返回的描述的意義
Distinct :一旦mysql找到了與行相聯合匹配的行,就不再搜索了。
Not exists :mysql優化了LEFT JOIN,一旦它找到了匹配LEFT JOIN標准的行,就不再搜索了。
Range checked for each Record(index map:#) :沒有找到理想的索引,因此對從前面表中來的每一個行組合,mysql檢查使用哪個索引,並用它來從表中返回行。這是使用索引的最慢的連接之一。
Using filesort :看到這個的時候,查詢就需要優化了。mysql需要進行額外的步驟來發現如何對返回的行排序。它根據連接類型以及存儲排序鍵值和匹配條件的全部行的行指針來排序全部行。
Using index :列數據是從僅僅使用了索引中的信息而沒有讀取實際的行動的表返回的,這發生在對表的全部的請求列都是同一個索引的部分的時候。
Using temporary :看到這個的時候,查詢需要優化了。這里,mysql需要創建一個臨時表來存儲結果,這通常發生在對不同的列集進行ORDER BY上,而不是GROUP BY上。
Where used :使用了WHERE從句來限制哪些行將與下一張表匹配或者是返回給用戶。如果不想返回表中的全部行,並且連接類型ALL或index,這就會發生,或者是查詢有問題。
顯示使用哪個列或常數與key一起從表中選擇行
9 rows
顯示mysql認為它執行查詢時必須檢查的行數
10 extra
關於MYSQL如何解析查詢的額外信息。Using temporary和Using filesort,意思MYSQL根本不能使用索引,結果是檢索會很慢
說明:extra列返回的描述的意義
Distinct :一旦mysql找到了與行相聯合匹配的行,就不再搜索了。
Not exists :mysql優化了LEFT JOIN,一旦它找到了匹配LEFT JOIN標准的行,就不再搜索了。
Range checked for each Record(index map:#) :沒有找到理想的索引,因此對從前面表中來的每一個行組合,mysql檢查使用哪個索引,並用它來從表中返回行。這是使用索引的最慢的連接之一。
Using filesort :看到這個的時候,查詢就需要優化了。mysql需要進行額外的步驟來發現如何對返回的行排序。它根據連接類型以及存儲排序鍵值和匹配條件的全部行的行指針來排序全部行。
Using index :列數據是從僅僅使用了索引中的信息而沒有讀取實際的行動的表返回的,這發生在對表的全部的請求列都是同一個索引的部分的時候。
Using temporary :看到這個的時候,查詢需要優化了。這里,mysql需要創建一個臨時表來存儲結果,這通常發生在對不同的列集進行ORDER BY上,而不是GROUP BY上。
Where used :使用了WHERE從句來限制哪些行將與下一張表匹配或者是返回給用戶。如果不想返回表中的全部行,並且連接類型ALL或index,這就會發生,或者是查詢有問題。
使用explain查看sql執行計划后,我們主要先看下type屬性,表示連接的類型,如果是ALL這種那就需要優化了,
再看下possible_key屬性,表示可以使用的索引,如果沒有則為null,key屬性表示mysql實際決定使用的索引,如果沒有選擇索引,鍵是null,
rows 表示mysql認為它執行查詢時必須檢查的行數,行數越多效率越低。
--索引類型
主鍵索引,唯一索引,組合索引,普通索引
--什么是索引
數據庫索引是數據庫管理系統中的一個排序的數據結構,以協助快速查詢,更新數據庫表中數據,索引的實現通常使用B樹(B-tree)以及其變種B+tree(一些高效率的算法)
--使用索引時有些不生效的情況
1、使用like關鍵字模糊查詢時,% 放在前面索引不起作用,只有“%”不在第一個位置,索引才會生效(like '%文'--索引不起作用)
2、使用聯合索引時,只有查詢條件中使用了這些字段中的第一個字段,索引才會生效
3、使用OR關鍵字的查詢,查詢語句的查詢條件中只有OR關鍵字,且OR前后的兩個條件中的列都是索引時,索引才會生效,否則索引不生效。
4、盡量避免在where子句中使用!=或<>操作符,否則引擎將放棄使用索引而進行全表掃描。
4、盡量避免在where子句中使用!=或<>操作符,否則引擎將放棄使用索引而進行全表掃描。
5、對查詢進行優化,應盡量避免全表掃描,首先應考慮在where以及order by涉及的列上建立索引。
6、應盡量避免在 where 子句中對字段進行表達式操作,這將導致引擎放棄使用索引而進行全表掃描。如:
select id from t where num/2=100
應改為:
select id from t where num=100*2
7、盡量避免在where子句中對字段進行函數操作,將導致引擎放棄使用索引而進行全表掃描。
應改為:
select id from t where num=100*2
7、盡量避免在where子句中對字段進行函數操作,將導致引擎放棄使用索引而進行全表掃描。
8、不要在 where 子句中的“=”左邊進行函數、算術運算或其他表達式運算,否則系統將可能無法正確使用索引。
9、並不是所有的索引對查詢都有效,sql是根據表中的數據來進行查詢優化的,當索引列有大量數據重復時,sql查詢不會去利用索引,如一表中有字段
sex,male,female幾乎個一半,那么即使在sex上建立了索引也對查詢效率起不了作用。
sex,male,female幾乎個一半,那么即使在sex上建立了索引也對查詢效率起不了作用。
10、索引並不是越多越好,索引固然可以提高相應的 select 的效率,但同時也降低了 insert 及 update 的效率,
因為 insert 或 update 時有可能會重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。一個表的索引數最好不要超過6個,
若太多則應考慮一些不常使用到的列上建的索引是否有 必要。
若太多則應考慮一些不常使用到的列上建的索引是否有 必要。
11、盡量使用數字型字段,若只含數值信息的字段盡量不要設計為字符型,這會降低查詢和連接的性能,並會增加存儲開銷。
這是因為引擎在處理查詢和連接時會 逐個比較字符串中每一個字符,而對於數字型而言只需要比較一次就夠了。
12、mysql查詢只使用一個索引,因此如果where子句中已經使用了索引的話,那么order by中的列是不會使用索引的。
因此數據庫默認排序可以符合要求的情況下不要使用排序操作,盡量不要包含多個列的排序,如果需要最好給這些列建復合索引。
13、order by 索引 ,不起作用的問題(除了主鍵索引之外):
1、 如果select 只查詢索引字段,order by 索引字段會用到索引,要不然就是全表排列;
2、如果有where 條件,比如where vtype=1 order by vtype asc . 這樣order by 也會用到索引!
2、如果有where 條件,比如where vtype=1 order by vtype asc . 這樣order by 也會用到索引!