MySQL優化之路


一、Mysql的存儲原理

索引相關

本質

索引是幫助MySQL高效獲取數據的排好序數據結構

​ 建索引,提高數據檢索的效率,降低數據庫的IO成本; 通過索引列對數據進行排序,降低數據排序的成本,降低了 CPU的消耗。

索引分類

  • 主鍵索引:主鍵自帶索引效果,性能很好
  • 普通索引:為普通列創建的索引
-- 格式
create index 索引名稱 on 表名(列名);
-- 示例
create index idx_name on user(name);
  • 唯一索引 : 索引列的值必須唯一,但允許有空值。比普通索引的性能要好
-- 格式
create unique index 索引名稱 on 表名(列名);
-- 示例
create unique index uniq_name on user(name);
  • 聯合索引 ( 開發常用 ) :一次性的為表中的多個列創建索引 (建議一個聯合索引不超過5個字段)

    ​ (最左前綴法則:如何命中聯合索引中的索引列)

-- 格式
create index 索引名稱 on 表名(列名1,列名2);
-- 示例
create index idx_name_age_password on user(name,age,password);
  • 全文索引:進行查詢時,數據源可能來自不同的字段或者表

    ​ MyISAM存儲引擎支持全文索引,在實際開發中並不會去使用而是使用搜索引擎中間件

總結

-- 創建索引
create [unique] index 索引名稱 on 表名(列名)
-- 刪除索引
drop index [索引名稱] on 表名
-- 查看索引
show index from 表名\G

為數據表添加索引

image-20210716181003243

索引的數據結構

  • 二叉樹 (鏈表情況)
  • 紅黑樹 (層次太多)
  • Hash表
    • 對索引的key進行一次hash計算就可以定位出數據存儲的位置
    • 很多時候Hash索引要比B+樹索引更高效
    • 僅能滿足“=”,“IN”,不支持范圍查詢
    • hash沖突問題
  • B Tree
    • 葉節點具有相同的深度,葉節點的指針為空
    • 所有索引元素不重復
    • 節點中的數據索引從左到右遞增排列
  • B+Tree (底層)
    • 非葉子節點不存儲data,只存儲索引(冗余),可以放更多的索引
    • 葉子節點包含所有索引字段
    • 葉子節點用指針連接,提高區間訪問的性能

image-20210716153655911

推薦一個外國的數據結構在線演示網站: Data Structure Visualization

INNODB與 MYISAM類型的區別

1、INNODB引擎----聚集索引
把索引和數據存放在一個文件中,通過找到索引后就能直接在索引樹上的葉子結點中獲得完整的數據。可以實現行鎖/表鎖

2、MYISAM----非聚集索引
把索引和數據存放在兩個文件中,查找到索引后還要去另一個文件中找數據,性能會慢一些。除此之外,MylSAM天然支持表鎖,而且支持全文索引。

創建索引的情況

  • 需要創建索引的情況:
1、主鍵自動建立唯一索引
2、頻繁作為查詢條件的字段應該創建索引
3、查詢中與其他表關聯的字段,外鍵關系建立索引
4、單鍵/組合索引的選擇問題 ?( 在高並發下傾向創建組合索引 )
5、查詢中排序的字段,排序字段通過索引去訪問將大大提高排序速度
6、查詢中統計或分組字段
  • 不需要創建索引的情況:
1、頻繁更新的字段不適合創建索引
2、經常增刪改的表
3、where條件里用不到的字段不創建索引
4、表記錄太少
5、如果某個數據列包含許多重復的內容,為他建立索引沒有太大的效果

Tip: 一個索引的選擇性越接近1,這個索引的效率就越高!

聯合索引

使用一個索引來實現多個表中字段的索引效果。

存儲方式:

image-20210807134000636

索引最左前綴原理

最左前綴法則是表示一條sql語句在聯合索引中有沒有走索引(命中索引/不會全表掃描)

聯合索引的底層存儲結構長什么樣?

image-20210716163829636

慢sql原因

  • 查詢語句寫的不好
  • 索引失效
  • 關聯過多的 join (設計缺陷或不得已的需求)
  • 服務器調優以及參數設置

二、Mysql性能查詢

image-20210807110122424

SQL優化的目的是為了SQL語句能夠具備優秀的查詢性能,實現這樣的目的有很多的途徑:

  • 工程優化如何實現︰數據庫標准、表的結構標准、字段的標准、創建索引 阿里:MySQL數據庫規范
  • SQL語句的優化:當前SQL語句有沒有命中索引。

explain

簡介

​ 使用EXPLAIN關鍵字可以模擬優化器執行sQL查詢語句,從而知道MySQL是如何處理你的SQL語句的。分析你的查詢語句或是表結構的性能瓶頸

詳解

MySQL Explain詳解 explain

作用

表的讀取順序
數據讀取操作的操作類型
哪些索引可以使用
哪些索引被實際使用
表之間的引用
每張表有多少行被優化器查詢

使用格式:explain + sql語句

信息image-20210716183939922

詳解

  1. id列 :id越大越先被執行,如果id相同,上面的先執行

  2. select_type列

類型 描述
simple 簡單查詢
primary 外部的主查詢
devived 在from后面的子查詢, 產生衍生表
subquery 在from的前面的子查詢
union 進行的聯合查詢

​ 關閉對mysql對衍生表的合並優化(演示)

set session optimizer_switch = 'derived_merge=off';
  1. table列 :表示這一列表示該sql正在訪問哪一張表。也可以看出正在訪問的衍生表

  2. type列

    type列可以直觀的判斷出當前的sql語句的性能。type里的取值和性能的優劣順序如下:

null > system > const > eq_ref > range > index > all
-- null
性能最好的,一般在使用了聚合函數操作索引列,結果直接從索引樹獲取即可

-- system
很少見 直接和一條記錄進行匹配

-- const
使用主鍵索引或者唯一索引和常量進行比較,性能也很好

-- eq_ref
在進行連接查詢時,連接查詢的條件中使用了本表的主鍵進行關聯

-- ref
	-- 簡單查詢
			使用普通列作為查詢條件
	-- 復雜查詢
			在進行連接查詢時,連接查詢的條件中使用了本表的普通索引列
			
-- range
在索引列上使用了范圍查找,性能是ok的

-- index
在查詢表中的所有的記錄,但是所有的記錄可以直接從索引樹上獲取,(表中字段均加索引)

-- ALL
全表掃描。就是要從頭到尾對表中的數據掃描一遍。這種查詢性能是一定要做優化的。
  1. possible_keys列

    顯示這一次查詢可能會用到的索引。mysql優化器查詢時會進行判斷,那么內部優化器就會讓此次查詢進行全表掃描————我們可以通過trace工具進行查看

  2. key列 :實際該sql語句使用的索引

  3. rows列 : 該sql語句可能要查詢的數據條數

  4. key_len列

    通過查看這一列的數值,推斷出本sql命中了聯合索引中的哪幾列。 key_len的計算規則

    image-20210807172458648

  5. extra列

    extra列提供了額外的信息,是能夠幫助我們判斷當前sql的是否使用了覆蓋索引、文件排序、使用了索引進行查詢條件等等的信息。

-- unsing index
使用了覆蓋索引 (指的是當前查詢的所有數據字段都是索引列,這就意味着可以直接從索引列中獲取數據,而不需要進行查表。使用覆蓋索引進行性能優化這種手段是之后sql優化經常要用到的。)

-- using where
where的條件沒有使用索引列。這種性能是不ok的,我們如果條件允許可以給列設置索引,也同樣盡可能的使用覆蓋索引。

-- using index condition
查詢的列沒有完全被索引覆蓋,並且where條件中使用普通索引

-- using temporary
會創建臨時表來執行,比如在沒有索引的列上執行去重操作,就需要臨時表來實現。(這種情況可以通過給列加索引進行優化。)

-- using filesort
MySQL對數據進行排序,都會使用磁盤驤完成,可能會借助內存,涉及到兩個概念︰單路排序、雙路排序

-- Select tables optimized away
當直接在索引列上使用聚合函數,意味着不需要操作表

三、mysql優化細節

索引優化建議

命中索引建議:

  • 對於SQL優化來說,要盡量保證type列的值是屬於range及以上級別

  • 不能在索引列上做計算、函數、類型轉換,會導致索引失效

  • 對於日期時間的處理 轉換成范圍查找

  • 盡量使用覆蓋索引

  • 使用不等於(!=或者<>)會導致全表掃描

  • 使用is null、 is not null會導致全表掃描

  • 使用like以通配符開頭('%xxx...")會導致全表掃描 (使用覆蓋索引或者搜索引擎中間件)

  • 字符串不加單引號會導致全表掃描

  • 少用or或in,MySQL內部優化器可能不使用索引 (使用多線程或者搜索引擎中間件)

  • 范圍查詢優化 (范圍大的拆分查找)

Trace工具

在執行計划中我們發現有的sql會走索引,有的sql即使明確使用了索引也不會走索引。mysql依據Trace工具的結論

-- 開啟trace 設置格式為JSON,設置trace的緩存大小,避免因為容量大小而不能顯示完整的跟蹤過程。
set optimier_trace="enabled=on",end_markers_in_JSON=on;
-- 執行sql語句
-- 獲得trace分析結果
select *from information_schema.optimizer_trace \G

Order by優化

在Order by中,如果排序會造成文件排序(在磁盤中完成排序,這樣的性能會比較差),那么就說明sql沒有命中索引,怎么解決? 可以使用最左前綴法則,讓排序遵循最左前綴法則,避免文件排序

優化手段:

  • 如果排序的字段創建了聯合索引,那么盡量在業務不沖突的情況下,遵循最左前綴法則來寫排序語句。
  • 如果文件排序沒辦法避免,那么盡量想辦法使用覆蓋索引。all->index

對於Group by而言 :本質上是先排序后分組,所以排序優化參考order by優化。

分頁查詢優化

-- 原始
Explain select * from employees limit 10000,10

-- 對於主鍵連續的情況下進行優化:(少見)
Explain select * from employees where id>10000 limit 10

-- 通過先進行覆蓋索引的查找,然后在使用join做連接查詢獲取所有數據。這樣比全表掃描要快
EXPLAIN select * from employees a inner join (select id from employees order by name limit 1000000,10) b on a.id = b.id;

join查詢優化

在這里插入圖片描述

in、exstis優化

在sql中如果A表是大表,B表是小表,那么使用in會更加合適。反之應該使用exists。image-20210807201300131

count優化

對於count的優化應該是架構層面的優化,因為count的統計是在一個產品會經常出現,而且每個用戶訪問,所以對於訪問頻率過高的數據建議維護在緩存中。

四、mysql的鎖機制

鎖的定義與分類

定義

鎖是用來解決多個任務(線程、進程)在並發訪問同一共享資源時帶來的數據安全問題。雖然使用鎖解決了數據安全問題,但是會帶來性能的影響,頻繁使用鎖的程序的性能是必然很差的。

對於數據管理軟件MySQL來說,必然會到任務的並發訪問。那么MySQL是怎么樣在數據安全和性能上做權衡的呢?——MVCC設計思想。

分類

  1. 從性能上划分:

    • 悲觀鎖:悲觀的認為當前並發非常嚴重,任何操作都是互斥,保證了線程的安全性,但降低了性能
    • 樂觀鎖:樂觀的認為當前並發並不嚴重,讀的時候可以,對於寫的情況,在進行上鎖;以CAS自旋鎖為例,性能高,但頻繁自旋會消耗很大的資源
  2. 從數據的操作細粒度划分:

    • 行鎖:對表中的某一行上鎖
    • 表鎖:對整張表上鎖(基本不用)
  3. 從數據庫的操作類型划分 (悲觀鎖):

    • 讀鎖:稱為共享鎖,對同樣數據進行讀來說 可以同時進行 但是不能執行寫操作
    • 寫鎖:稱為排他鎖,上鎖之后與釋放鎖之前,在整個過程之中不能進行任何的並發操作(其他的任務讀與寫都無法進行)

    MylSAM只支持表鎖,但不支持行鎖, InnoDB可以支持行鎖 在並發事務里,每個事務的增刪改的操作相當於是上了行鎖。

# 表鎖
-- 對表上讀鎖或者寫鎖格式
lock table 表名 read/write;
-- 釋放當前鎖
unlock tables
-- 查看表的上鎖情況
show open tables
# 行鎖  
# MySQL 是默認開啟事務自動提交的
SET autocommit = 0;  # 關閉
SET autocommit = 1;  # 開啟  默認的
-- 開啟事務 
begin;
-- 上行鎖  對id = 8 的這行數據上鎖
update `user` set name='前度' where id = 8;
-- 方式2
select * from `user` where id = 8 for update;
-- 釋放鎖
commint;

MVCC設計思想

​ MVCC,即多版本並發控制。MVCC是一種並發控制的方法,一般在數據庫管理系統中,實現對數據庫的並發訪問,在編程語言中實現事務內存。

事務的特性

  • 原子性:一個事務是一個最小的操作單位,要么都成功,要么都失敗
  • 隔離性:數據庫為每個用戶開啟的事務,不能被其他事務影響
  • 一致性:事務提交之前與回滾之后的數據一致
  • 持久性:事務一旦提交不可逆 被持久化到數據庫中

事務的隔離級別

  • read uncommitted(讀未提交) : 一個事務讀取了另一個事務還沒有提交的數據 會出現臟讀的情況
  • read committed(讀已提交) : 已經解決了臟讀問題,在一個事務中只會讀取另一個事務已提交的數據,出現不可重復讀情況
  • repeatable read (可重復讀): 默認級別 在一個事務中每次讀取的數據都是一致的.不會出現臟讀和不可重復讀的問題。但會與幻讀情況
  • Serializable: 串行化的隔離界別直接不允許事務的並發發生,不存在任何的並發性。相當於鎖表,性能非常差,一般都不考慮 通過上行鎖來解決幻讀問題
-- 設置隔離級別
set session transaction isolation level 隔離級別;
隔離導致的一些問題
 臟讀: 一個事務讀取了另外一個事務未提交的數據
 不可重復讀:在一個事務內讀取表中的某一行數據,多次讀取結果不同
 虛讀,幻讀:是指在一個事務內讀取了別的事務插入的數據,導致前后讀取不一致(一般是行影響,多了一行)

MySQL在讀和寫的操作中,對讀的性能做了並發性的保障,讓所有的讀都是快照讀,對於寫的時候,進行版本控制,如果真實數據的版本比快照版本要新,那么寫之前就要進行版本(快照〉更新,這樣就可以既能夠提高讀的並發性,又能夠保證寫的數據安全。
image-20210808103439712

死鎖與間隙鎖

死鎖

​ 所謂的死鎖,就是開啟的鎖沒有辦法關閉,導致資源的訪問因為無法獲得鎖而處於阻塞狀態image-20210808105745491

間隙鎖

​ 行鎖只能對某一行上鎖,如果相對某一個范圍上鎖,就可以使用間隙鎖。間隙鎖給的條件where id>13 and id<19,會 對13和19所處的間隙進行上鎖。
image-20210808110342717

五、部分面試題

為什么非主鍵索引的葉子節點存放的數據是主鍵值?

​ 如果普通索引中不存放主鍵,而存放完整數據,那么就會造成:

  1. 數據冗余,雖然提升了查詢性能,但是需要更多的空間來存放冗余的數據

  2. 維護麻煩:一個地方修改數據,需要在多棵索引樹上修改。

為什么建議InnoDB表必須建主鍵,並且推薦使用整型的自增主鍵?

mysql 為什么建議 innodb 表要建一個主鍵?

  • 如果有一個主鍵,可以直接使用主鍵建索引

  • 如果沒有主鍵,會從第一列開始選擇一列所有值都不相同的,作為索引列

  • 如果沒有選到唯一值的索引列,mysql 會建立一個隱藏列,維護一個唯一id,以此來組織索引

    為什么推薦使用整形作為主鍵?

  • 在索引中查找數據時,減少比較的性能。

  • 使用整形作為主鍵相比字符型可以節省數據頁的空間。

  • 構建索引 b+ 樹時,為了保證索引的有序性,使用整形可以避免頁分裂。

    主鍵為什么要自增?

  • 索引結構 b+ 樹,具有有序的特性。
    -如果主鍵不是自增的,在進行增刪數據的時候,會判斷數據應該存放的位置,進行插入和刪除,為了保持平衡,會對數據頁進行分裂等操作移動數據,嚴重影響性能,所以主鍵需要是自增的,插入時,插入在索引數據頁最后。


The End~~


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM