作為開發也要了解的 mysql 優化思路

本文轉載自查看原文 2018-04-23 10:09 1404 mysql/ 索引/ Sql/ mysql 優化

作為開發人員，數據庫知識掌握的可能不是很深入，但是一些基本的技能還是要有時間學習一下的。作為一個數據庫菜鳥，厚着臉皮來總結一下 mysql 的基本的不能再基本的優化方法。

為了更好的說明，我假想出來了一個業務場景，可能在實際業務中並不存在這樣的場景，只為舉例說明問題：

表結構說明

用戶賬號表（account），主要存儲用戶賬號、密碼、注冊時間等信息，1萬條數據
用戶基本信息表（userinfo），主要存儲用戶個人信息，包括年齡、性別等，關聯 account 表，關聯字段 account_id，1萬條數據
訂單表（orderinfo）,主要存儲用戶訂單信息，關聯account 表，關聯字段 account_id，10萬條數據

如果需要表結構和數據初始化的腳本，可以在本公眾號回復關鍵字「mysql」，這里就不占篇幅了。

業務需求說明

統計出年齡大於 30 歲，性別為女（0）的用戶所下訂單的總數量。 當然用其他方式可以實現，但這里不考慮非數據庫處理的其他方式。

下面是 sql 查詢語句，三個表做 join 查詢，並通過三個條件做篩選。做查詢之前，這三個表都沒有做其他處理，只是主鍵 INT 類型設置了自增。執行下面的語句，在我本地的時間是 35s 左右，這已經不能忍受了。

SELECT
	count(*)
FROM
	account a
LEFT JOIN userinfo u ON a.id = u.account_id
LEFT JOIN orderinfo o on a.id =o.account_id
WHERE
	u.age >= 30 and u.sex=0  and o.id is NOT NULL;
	
	## 查詢時間30多秒

使用 explain 命令分析

碰到這種執行時間非常慢的慢查詢語句時，就要有請神器 explain 命令了，這是 mysql 提供的查詢語句優化分析工具。

使用方法非常簡單，就是在查詢語句前加上 explain 命令，比如分析上面的語句就是這樣的：

EXPLAIN 
SELECT
				count(*)
FROM
	account a
LEFT JOIN userinfo u ON a.id = u.account_id
LEFT join orderinfo o on a.id =o.account_id
WHERE
	 u.age >= 30 and u.sex=0 and o.id is NOT NULL;

命令執行后是下面這樣的結果：

下面分別解釋一下各個字段的含義：

id

每個 SELECT 都會自動分配一個唯一的標識符。如果在語句中沒子查詢或關聯查詢，只有唯一的select，每行都將顯示1。否則，內層的select語句一般會順序編號，對應於其在原始語句中的位置。本例中因為只有一個 select ,所以 id 都是1。

下面兩條語句會編號為1、2，可以運行試一下：

#  包含子查詢的
EXPLAIN 
SELECT * FROM account
WHERE id IN 
	(		SELECT 			max(account_id) 		FROM 			orderinfo	);
	
	#  帶有union的聯合查詢
	EXPLAIN SELECT *
FROM account
WHERE id = 100
UNION ALL
SELECT *
FROM account
WHERE id = 101;

select_type

查詢的類型。有如下幾種類型：

table

查詢的是哪個表，顯示表名或者別名

partitions

查詢的分區，如果數據庫沒有做過分區操作，此字段為 null

type

表示查詢語句的掃描類型，有如下幾種：

性能從高到低為：system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

possible_keys

表示查詢時, 能夠使用到的索引。但是, 即使有些索引在 possible_keys 中出現, 但是並不表示此索引會真正地被使用到。在查詢時具體使用了哪些索引, 由 key 字段決定

key

當前查詢真正使用的索引

ref

表示使用了哪個列或 const 與 key(查詢所用到的索引) 一起從表中做選擇

rows

可以 sql 的優化過程就是為了減小 rows 字段的數量，rows 表示要掃描的行數，行數越多，當然查詢的時間就越長。

extra

該列顯示MySQL在查詢過程中的一些詳細信息，MySQL查詢優化器執行查詢的過程中對查詢計划的重要補充信息。

Using filesort：當 Extra 中有 Using filesort 時, 表示 MySQL 需額外的排序操作, 不能通過索引順序達到排序效果. 一般有 Using filesort, 都建議優化去掉, 因為這樣的查詢 CPU 資源消耗大.

Using index："覆蓋索引掃描", 表示查詢在索引樹中就可查找所需數據, 不用掃描表數據文件, 往往說明性能不錯；

Using temporary：查詢有使用臨時表, 一般出現於排序, 分組和多表 join 的情況, 查詢效率不高, 建議優化.

回過頭來看我們上面的例子，這三個表只有主鍵 id 有索引。

1、首先先掃描 userinfo 表，type 為 ALL ，為全表掃描， rows 字段為 10000 行，掃描了 10000 行。

2、然后連接了 account 表，並使用索引 PRIMARY (也就是主鍵 id),通過 ref userinfo.account_id，進行了行選擇，所以這里的 rows 為1，也就是沒有進行掃描，直接定位到了要查詢的行。

3、之后掃描 orderinfo 表，type 為 ALL ,還是全表掃描，rows 為 99900。

所以三次掃描執行下來，在我本地的機器上平均35s左右。

簡單優化

優化原則大體上是這樣的：

sql 層面有優化空間的，先優化了再說。最常用的手段就是加索引。
如果 sql 語句無法優化了，看一下是不是能夠修改 sql 查詢語句的結構，比如有子查詢的語句，能不能用 union 查詢兩次或多次。
如果 sql 層面確實無法優化了，考慮用程序的方式，或者修改架構。但並不是說 sql 層面優化了，程序中就不需要優化了，兩者並不沖突，當然是性能越快越好了。

來看一下這個例子，join 了三個表，但這三個表都只有主鍵有索引。第一步優化：加索引。加索引有一下幾個原則：

1、較頻繁的作為查詢條件的字段應該創建索引

2、唯一性太差的字段不適合單獨創建索引，即使頻繁作為查詢條件，也就是區分度太低，比如性別，比如查看性別的區分度可以用這個語句：

SELECT
	count(*),
	sex
FROM
	userinfo
GROUP BY
	sex;
	
	+----------+------+
| count(*) | sex  |
+----------+------+
| 5000     | 0    |
| 5000     | 1    |
+----------+------+

可以看到，一共有兩個性別，每個5000，即使加了索引，每次也需要掃描一半的數據。

3、更新非常頻繁的字段不適合創建索引；

4、不會出現在 WHERE 子句中的字段不該創建索引

先給 userinfo 表的 account_id 字段加上索引，因為 join 連接條件是用的它。加索引的命令如下：

ALTER TABLE userinfo ADD INDEX index_account_id (`account_id`);

查看索引：

SHOW INDEX FROM userinfo;

順便說以下刪除索引的命令：

ALTER TABLE userinfo DROP INDEX index_account_id;

再次執行 explain 命令，結果如下：

看到沒，查詢 userinfo 時使用了剛剛創建的索引，rows 馬上變成了1，再次執行，執行時間就下降到了0.5s以下。

然后再給 orderinfo 的 account_id 建立索引，再次 explain ,分析如下：

這次 orderinfo 表查詢的時候走了索引，但是 userinfo 表沒有，mysql 會自動選擇最優的索引。再次執行查詢，查詢時間降到了30ms左右。

如果查詢的條件較多，還可以考慮聯合索引，比如本例中可以考慮給account_id、age、sex 建立聯合索引，只是舉個例子，sex 字段其實並不適合納入索引列。

ALTER TABLE userinfo ADD INDEX index_accountid_age_sex (`account_id`, `age`, `sex`);

但由於 mysql 的自動選擇最優索引的機制，即使加了聯合索引，也還是會優先使用 orderinfo 的索引，因為使用那個索引效率更高。但是如果 userinfo 的記錄更多，那結果就不一樣了。

注意點

1、除非列有要求要存空值 null，否則建議列設置為不允許為 null，因為 null 無法利用索引，而且會占用額外的空間；

2、建議減少對大表的 join 查詢，如果是 myisam 引擎會產生表鎖，會導致其他寫操作被阻塞。innodb 引擎會產生行鎖，倒是影響不大；

最后

本篇主要是為了說明 mysql 的分析方法，就是用 explain 命令。發現問題是關鍵步驟，至於解決方法，每個場景的解決方法都會有不同，這就需要各位結合自身經驗，或者借助搜索引擎，或者請教更專業的人來想辦法了。

另外，關注公眾號回復關鍵字「mysql」，獲取本例中的表結構和初始數據。

微信公眾號，多謝關注：

還可以加入 Java 微信討論群（如果二維碼過期：請加微信:fengdezitai001 ,備注：cnblogs）：

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 前端開發需要了解的JS插件 Android 開發你需要了解的那些事 Java開發者需要了解的硬件知識 (一)、CPU篇關於 MySQL LEFT JOIN 你可能需要了解的三點軟件開發除了23種設計模式，還有7個開發原則需要了解你需要了解的HTTP協議你需要了解的JS框架使用django框架進行web項目開發需要了解的知識 SQL優化的思路及基本原則（mysql） Qt QThread必須要了解的幾個函數