21 | 為什么我只改一行的語句，鎖這么多？

本文轉載自查看原文 2019-01-24 13:17 841

在上一篇文章中，我和你介紹了間隙鎖和next-key lock的概念，但是並沒有說明加鎖規則。間隙鎖的概念理解起來確實有點兒難，尤其在配合上行鎖以后，很容易在判斷是否會出現鎖等待的問題上犯錯。

所以今天，我們就先從這個加鎖規則開始吧。

首先說明一下，這些加鎖規則我沒在別的地方看到過有類似的總結，以前我自己判斷的時候都是想着代碼里面的實現來腦補的。這次為了總結成不看代碼的同學也能理解的規則，是我又重新刷了代碼臨時總結出來的。所以，這個規則有以下兩條前提說明：

MySQL后面的版本可能會改變加鎖策略，所以這個規則只限於截止到現在的最新版本，即5.x系列<=5.7.24，8.0系列 <=8.0.13。
如果大家在驗證中有發現bad case的話，請提出來，我會再補充進這篇文章，使得一起學習本專欄的所有同學都能受益。

因為間隙鎖在可重復讀隔離級別下才有效，所以本篇文章接下來的描述，若沒有特殊說明，默認是可重復讀隔離級別。

我總結的加鎖規則里面，包含了兩個“原則”、兩個“優化”和一個“bug”。

原則1：加鎖的基本單位是next-key lock。希望你還記得，next-key lock是前開后閉區間。
原則2：查找過程中訪問到的對象才會加鎖。
優化1：索引上的等值查詢，給唯一索引加鎖的時候，next-key lock退化為行鎖。
優化2：索引上的等值查詢，向右遍歷時且最后一個值不滿足等值條件的時候，next-key lock退化為間隙鎖。
一個bug：唯一索引上的范圍查詢會訪問到不滿足條件的第一個值為止。

我還是以上篇文章的表t為例，和你解釋一下這些規則。表t的建表語句和初始化語句如下。

CREATE TABLE `t` (
`id` int(11) NOT NULL,
`c` int(11) DEFAULT NULL,
`d` int(11) DEFAULT NULL,
PRIMARY KEY (`id`),
KEY `c` (`c`)
) ENGINE=InnoDB;

insert into t values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);

接下來的例子基本都是配合着圖片說明的，所以我建議你可以對照着文稿看，有些例子可能會“毀三觀”，也建議你讀完文章后親手實踐一下。

案例一：等值查詢間隙鎖

第一個例子是關於等值條件操作間隙：

圖1 等值查詢的間隙鎖

由於表t中沒有id=7的記錄，所以用我們上面提到的加鎖規則判斷一下的話：

根據原則1，加鎖單位是next-key lock，session A加鎖范圍就是(5,10]；
同時根據優化2，這是一個等值查詢(id=7)，而id=10不滿足查詢條件，next-key lock退化成間隙鎖，因此最終加鎖的范圍是(5,10)。

所以，session B要往這個間隙里面插入id=8的記錄會被鎖住，但是session C修改id=10這行是可以的。

案例二：非唯一索引等值鎖

第二個例子是關於覆蓋索引上的鎖：

圖2 只加在非唯一索引上的鎖

看到這個例子，你是不是有一種“該鎖的不鎖，不該鎖的亂鎖”的感覺？我們來分析一下吧。

這里session A要給索引c上c=5的這一行加上讀鎖。

根據原則1，加鎖單位是next-key lock，因此會給(0,5]加上next-key lock。
要注意c是普通索引，因此僅訪問c=5這一條記錄是不能馬上停下來的，需要向右遍歷，查到c=10才放棄。根據原則2，訪問到的都要加鎖，因此要給(5,10]加next-key lock。
但是同時這個符合優化2：等值判斷，向右遍歷，最后一個值不滿足c=5這個等值條件，因此退化成間隙鎖(5,10)。
根據原則2 ，只有訪問到的對象才會加鎖，這個查詢使用覆蓋索引，並不需要訪問主鍵索引，所以主鍵索引上沒有加任何鎖，這就是為什么session B的update語句可以執行完成。

但session C要插入一個(7,7,7)的記錄，就會被session A的間隙鎖(5,10)鎖住。

需要注意，在這個例子中，lock in share mode只鎖覆蓋索引，但是如果是for update就不一樣了。執行 for update時，系統會認為你接下來要更新數據，因此會順便給主鍵索引上滿足條件的行加上行鎖。

這個例子說明，鎖是加在索引上的；同時，它給我們的指導是，如果你要用lock in share mode來給行加讀鎖避免數據被更新的話，就必須得繞過覆蓋索引的優化，在查詢字段中加入索引中不存在的字段。比如，將session A的查詢語句改成select d from t where c=5 lock in share mode。你可以自己驗證一下效果。

案例三：主鍵索引范圍鎖

第三個例子是關於范圍查詢的。

舉例之前，你可以先思考一下這個問題：對於我們這個表t，下面這兩條查詢語句，加鎖范圍相同嗎？

mysql> select * from t where id=10 for update;
mysql> select * from t where id>=10 and id

你可能會想，id定義為int類型，這兩個語句就是等價的吧？其實，它們並不完全等價。

在邏輯上，這兩條查語句肯定是等價的，但是它們的加鎖規則不太一樣。現在，我們就讓session A執行第二個查詢語句，來看看加鎖效果。

圖3 主鍵索引上范圍查詢的鎖

現在我們就用前面提到的加鎖規則，來分析一下session A 會加什么鎖呢？

開始執行的時候，要找到第一個id=10的行，因此本該是next-key lock(5,10]。根據優化1，主鍵id上的等值條件，退化成行鎖，只加了id=10這一行的行鎖。
范圍查找就往后繼續找，找到id=15這一行停下來，因此需要加next-key lock(10,15]。

所以，session A這時候鎖的范圍就是主鍵索引上，行鎖id=10和next-key lock(10,15]。這樣，session B和session C的結果你就能理解了。

這里你需要注意一點，首次session A定位查找id=10的行的時候，是當做等值查詢來判斷的，而向右掃描到id=15的時候，用的是范圍查詢判斷。

案例四：非唯一索引范圍鎖

接下來，我們再看兩個范圍查詢加鎖的例子，你可以對照着案例三來看。

需要注意的是，與案例三不同的是，案例四中查詢語句的where部分用的是字段c。

圖4 非唯一索引范圍鎖

這次session A用字段c來判斷，加鎖規則跟案例三唯一的不同是：在第一次用c=10定位記錄的時候，索引c上加了(5,10]這個next-key lock后，由於索引c是非唯一索引，沒有優化規則，也就是說不會蛻變為行鎖，因此最終sesion A加的鎖是，索引c上的(5,10] 和(10,15] 這兩個next-key lock。

所以從結果上來看，sesson B要插入（8,8,8)的這個insert語句時就被堵住了。

這里需要掃描到c=15才停止掃描，是合理的，因為InnoDB要掃到c=15，才知道不需要繼續往后找了。

案例五：唯一索引范圍鎖bug

前面的四個案例，我們已經用到了加鎖規則中的兩個原則和兩個優化，接下來再看一個關於加鎖規則中bug的案例。

圖5 唯一索引范圍鎖的bug

session A是一個范圍查詢，按照原則1的話，應該是索引id上只加(10,15]這個next-key lock，並且因為id是唯一鍵，所以循環判斷到id=15這一行就應該停止了。

但是實現上，InnoDB會往前掃描到第一個不滿足條件的行為止，也就是id=20。而且由於這是個范圍掃描，因此索引id上的(15,20]這個next-key lock也會被鎖上。

所以你看到了，session B要更新id=20這一行，是會被鎖住的。同樣地，session C要插入id=16的一行，也會被鎖住。

照理說，這里鎖住id=20這一行的行為，其實是沒有必要的。因為掃描到id=15，就可以確定不用往后再找了。但實現上還是這么做了，因此我認為這是個bug。

我也曾找社區的專家討論過，官方bug系統上也有提到，但是並未被verified。所以，認為這是bug這個事兒，也只能算我的一家之言，如果你有其他見解的話，也歡迎你提出來。

案例六：非唯一索引上存在"等值"的例子

接下來的例子，是為了更好地說明“間隙”這個概念。這里，我給表t插入一條新記錄。

mysql> insert into t values(30,10,30);

新插入的這一行c=10，也就是說現在表里有兩個c=10的行。那么，這時候索引c上的間隙是什么狀態了呢？你要知道，由於非唯一索引上包含主鍵的值，所以是不可能存在“相同”的兩行的。

圖6 非唯一索引等值的例子

可以看到，雖然有兩個c=10，但是它們的主鍵值id是不同的（分別是10和30），因此這兩個c=10的記錄之間，也是有間隙的。

圖中我畫出了索引c上的主鍵id。為了跟間隙鎖的開區間形式進行區別，我用(c=10,id=30)這樣的形式，來表示索引上的一行。

現在，我們來看一下案例六。

這次我們用delete語句來驗證。注意，delete語句加鎖的邏輯，其實跟select ... for update 是類似的，也就是我在文章開始總結的兩個“原則”、兩個“優化”和一個“bug”。

圖7 delete 示例

這時，session A在遍歷的時候，先訪問第一個c=10的記錄。同樣地，根據原則1，這里加的是(c=5,id=5)到(c=10,id=10)這個next-key lock。

然后，session A向右查找，直到碰到(c=15,id=15)這一行，循環才結束。根據優化2，這是一個等值查詢，向右查找到了不滿足條件的行，所以會退化成(c=10,id=10) 到 (c=15,id=15)的間隙鎖。

也就是說，這個delete語句在索引c上的加鎖范圍，就是下圖中藍色區域覆蓋的部分。

圖8 delete加鎖效果示例

這個藍色區域左右兩邊都是虛線，表示開區間，即(c=5,id=5)和(c=15,id=15)這兩行上都沒有鎖。

案例七：limit 語句加鎖

例子6也有一個對照案例，場景如下所示：

圖9 limit 語句加鎖

這個例子里，session A的delete語句加了 limit 2。你知道表t里c=10的記錄其實只有兩條，因此加不加limit 2，刪除的效果都是一樣的，但是加鎖的效果卻不同。可以看到，session B的insert語句執行通過了，跟案例六的結果不同。

這是因為，案例七里的delete語句明確加了limit 2的限制，因此在遍歷到(c=10, id=30)這一行之后，滿足條件的語句已經有兩條，循環就結束了。

因此，索引c上的加鎖范圍就變成了從（c=5,id=5)到（c=10,id=30)這個前開后閉區間，如下圖所示：

圖10 帶limit 2的加鎖效果

可以看到，(c=10,id=30）之后的這個間隙並沒有在加鎖范圍里，因此insert語句插入c=12是可以執行成功的。

這個例子對我們實踐的指導意義就是，在刪除數據的時候盡量加limit。這樣不僅可以控制刪除數據的條數，讓操作更安全，還可以減小加鎖的范圍。

案例八：一個死鎖的例子

前面的例子中，我們在分析的時候，是按照next-key lock的邏輯來分析的，因為這樣分析比較方便。最后我們再看一個案例，目的是說明：next-key lock實際上是間隙鎖和行鎖加起來的結果。

你一定會疑惑，這個概念不是一開始就說了嗎？不要着急，我們先來看下面這個例子：

圖11 案例八的操作序列

現在，我們按時間順序來分析一下為什么是這樣的結果。

session A 啟動事務后執行查詢語句加lock in share mode，在索引c上加了next-key lock(5,10] 和間隙鎖(10,15)；
session B 的update語句也要在索引c上加next-key lock(5,10] ，進入鎖等待；
然后session A要再插入(8,8,8)這一行，被session B的間隙鎖鎖住。由於出現了死鎖，InnoDB讓session B回滾。

你可能會問，session B的next-key lock不是還沒申請成功嗎？

其實是這樣的，session B的“加next-key lock(5,10] ”操作，實際上分成了兩步，先是加(5,10)的間隙鎖，加鎖成功；然后加c=10的行鎖，這時候才被鎖住的。

也就是說，我們在分析加鎖規則的時候可以用next-key lock來分析。但是要知道，具體執行的時候，是要分成間隙鎖和行鎖兩段來執行的。

小結

這里我再次說明一下，我們上面的所有案例都是在可重復讀隔離級別(repeatable-read)下驗證的。同時，可重復讀隔離級別遵守兩階段鎖協議，所有加鎖的資源，都是在事務提交或者回滾的時候才釋放的。

在最后的案例中，你可以清楚地知道next-key lock實際上是由間隙鎖加行鎖實現的。如果切換到讀提交隔離級別(read-committed)的話，就好理解了，過程中去掉間隙鎖的部分，也就是只剩下行鎖的部分。

其實讀提交隔離級別在外鍵場景下還是有間隙鎖，相對比較復雜，我們今天先不展開。

另外，在讀提交隔離級別下還有一個優化，即：語句執行過程中加上的行鎖，在語句執行完成后，就要把“不滿足條件的行”上的行鎖直接釋放了，不需要等到事務提交。

也就是說，讀提交隔離級別下，鎖的范圍更小，鎖的時間更短，這也是不少業務都默認使用讀提交隔離級別的原因。

不過，我希望你學過今天的課程以后，可以對next-key lock的概念有更清晰的認識，並且會用加鎖規則去判斷語句的加鎖范圍。

在業務需要使用可重復讀隔離級別的時候，能夠更細致地設計操作數據庫的語句，解決幻讀問題的同時，最大限度地提升系統並行處理事務的能力。

經過這篇文章的介紹，你再看一下上一篇文章最后的思考題，再來嘗試分析一次。

我把題目重新描述和簡化一下：還是我們在文章開頭初始化的表t，里面有6條記錄，圖12的語句序列中，為什么session B的insert操作，會被鎖住呢？

圖12 鎖分析思考題

另外，如果你有興趣多做一些實驗的話，可以設計好語句序列，在執行之前先自己分析一下，然后實際地驗證結果是否跟你的分析一致。

對於那些你自己無法解釋的結果，可以發到評論區里，后面我爭取挑一些有趣的案例在文章中分析。

你可以把你關於思考題的分析寫在留言區，也可以分享你自己設計的鎖驗證方案，我會在下一篇文章的末尾選取有趣的評論跟大家分享。感謝你的收聽，也歡迎你把這篇文章分享給更多的朋友一起閱讀。

上期問題時間

上期的問題，我在本期繼續作為了課后思考題，所以會在下篇文章再一起公布“答案”。

這里，我展開回答一下評論區幾位同學的問題。

@令狐少俠說，以前一直認為間隙鎖只在二級索引上有。現在你知道了，有間隙的地方就可能有間隙鎖。
@浪里白條同學問，如果是varchar類型，加鎖規則是什么樣的。
回答：實際上在判斷間隙的時候，varchar和int是一樣的，排好序以后，相鄰兩個值之間就有間隙。
有幾位同學提到說，上一篇文章自己驗證的結果跟案例一不同，就是在session A執行完這兩個語句：

begin;
select * from t where d=5 for update; /*Q1*/

以后，session B 的update 和session C的insert 都會被堵住。這是不是跟文章的結論矛盾？

其實不是的，這個例子用的是反證假設，就是假設不堵住，會出現問題；然后，推導出session A需要鎖整個表所有的行和所有間隙。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 element 表格只展開一行（點擊下一行上一行關閉）一行轉多行及多行轉一行的 hive語句 sql語句最后一行顯示統計。省一行是一行：在if語句中使用C# 7.0的模式匹配 C語言一行語句太長的換行處理方法 mysql 鎖問題 (相同索引鍵值或同一行或間隙鎖的沖突) Excel多個sheet合並成一個sheet，只保留一行表頭 sed每次只替換一行中的第一個命中 R合並數據框有重復匹配時只保留第一行 sql 相同記錄只取一條（可以取同一行記錄的其他字段）