極客時間 mysql實戰45講下載讀 08講事務到底是隔離的還是不隔離的筆記

本文轉載自查看原文 2019-05-21 23:37 449 mysql/ 數據庫

筆記體會：

1.innodb支持RC和RR隔離級別實現是用的一致性視圖(consistent read view)

2.事務在啟動時會拍一個快照,這個快照是基於整個庫的.
基於整個庫的意思就是說一個事務內,整個庫的修改對於該事務都是不可見的(對於快照讀的情況)
如果在事務內select t表,另外的事務執行了DDL t表,根據發生時間,要嘛鎖住要嘛報錯(參考第六章)

3.事務是如何實現的MVCC呢?
(1)每個事務都有一個事務ID,叫做transaction id(嚴格遞增)
(2)事務在啟動時,找到已提交的最大事務ID記為up_limit_id。
(3)事務在更新一條語句時,比如id=1改為了id=2.會把id=1和該行之前的row trx_id寫到undo log里,
並且在數據頁上把id的值改為2,並且把修改這條語句的transaction id記在該行行頭
(4)再定一個規矩,一個事務要查看一條數據時,必須先用該事務的up_limit_id與該行的transaction id做比對,
如果up_limit_id>=transaction id,那么可以看.如果up_limit_id<transaction id,則只能去undo log里去取。去undo log查找數據的時候,也需要做比對,必須up_limit_id>transaction id,才返回數據

4.什么是當前讀,由於當前讀都是先讀后寫,只能讀當前的值,所以為當前讀.會更新事務內的up_limit_id為該事務的transaction id

5.為什么rr能實現可重復讀而rc不能,分兩種情況
(1)快照讀的情況下,rr不能更新事務內的up_limit_id,
而rc每次會把up_limit_id更新為快照讀之前最新已提交事務的transaction id,則rc不能可重復讀
(2)當前讀的情況下,rr是利用record lock+gap lock來實現的,而rc沒有gap,所以rc不能可重復讀

正文

我在第3篇文章和你講事務隔離級別的時候提到過，如果是可重復讀隔離級別，事務T啟動的時候會創建一個視圖read-view，之后事務T執行期間，即使有其他事務修改了數據，事務T看到的仍然跟在啟動時看到的一樣。也就是說，一個在可重復讀隔離級別下執行的事務，好像與世無爭，不受外界影響。

但是，我在上一篇文章中，和你分享行鎖的時候又提到，一個事務要更新一行，如果剛好有另外一個事務擁有這一行的行鎖，它又不能這么超然了，會被鎖住，進入等待狀態。問題是，既然進入了等待狀態，那么等到這個事務自己獲取到行鎖要更新數據的時候，它讀到的值又是什么呢？

我給你舉一個例子吧。下面是一個只有兩行的表的初始化語句。

mysql> CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `k` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;
insert into t(id, k) values(1,1),(2,2);

圖1 事務A、B、C的執行流程

這里，我們需要注意的是事務的啟動時機。

begin/start transaction 命令並不是一個事務的起點，在執行到它們之后的第一個操作InnoDB表的語句（第一個快照讀語句），事務才真正啟動。如果你想要馬上啟動一個事務，可以使用start transaction with consistent snapshot 這個命令。

還需要注意的是，在整個專欄里面，我們的例子中如果沒有特別說明，都是默認autocommit=1。

在這個例子中，事務C沒有顯式地使用begin/commit，表示這個update語句本身就是一個事務，語句完成的時候會自動提交。事務B在更新了行之后查詢; 事務A在一個只讀事務中查詢，並且時間順序上是在事務B的查詢之后。

這時，如果我告訴你事務B查到的k的值是3，而事務A查到的k的值是1，你是不是感覺有點暈呢？

所以，今天這篇文章，我其實就是想和你說明白這個問題，希望借由把這個疑惑解開的過程，能夠幫助你對InnoDB的事務和鎖有更進一步的理解。

在MySQL里，有兩個“視圖”的概念：

一個是view。它是一個用查詢語句定義的虛擬表，在調用的時候執行查詢語句並生成結果。創建視圖的語法是create view ... ，而它的查詢方法與表一樣。
另一個是InnoDB在實現MVCC時用到的一致性讀視圖，即consistent read view，用於支持RC（Read Committed，讀提交）和RR（Repeatable Read，可重復讀）隔離級別的實現。

它沒有物理結構，作用是事務執行期間用來定義“我能看到什么數據”。

在第3篇文章《事務隔離：為什么你改了我還看不見？》中，我跟你解釋過一遍MVCC的實現邏輯。今天為了說明查詢和更新的區別，我換一個方式來說明，把read view拆開。你可以結合這兩篇文章的說明來更深一步地理解MVCC。

“快照”在MVCC里是怎么工作的？

在可重復讀隔離級別下，事務在啟動的時候就“拍了個快照”。注意，這個快照是基於整庫的。

這時，你會說這看上去不太現實啊。如果一個庫有100G，那么我啟動一個事務，MySQL就要拷貝100G的數據出來，這個過程得多慢啊。可是，我平時的事務執行起來很快啊。

實際上，我們並不需要拷貝出這100G的數據。我們先來看看這個快照是怎么實現的。

InnoDB里面每個事務有一個唯一的事務ID，叫作transaction id。它是在事務開始的時候向InnoDB的事務系統申請的，是按申請順序嚴格遞增的。

而每行數據也都是有多個版本的。每次事務更新數據的時候，都會生成一個新的數據版本，並且把transaction id賦值給這個數據版本的事務ID，記為row trx_id。同時，舊的數據版本要保留，並且在新的數據版本中，能夠有信息可以直接拿到它。

也就是說，數據表中的一行記錄，其實可能有多個版本(row)，每個版本有自己的row trx_id。

如圖2所示，就是一個記錄被多個事務連續更新后的狀態。

圖2 行狀態變更圖

圖中虛線框里是同一行數據的4個版本，當前最新版本是V4，k的值是22，它是被transaction id 為25的事務更新的，因此它的row trx_id也是25。

你可能會問，前面的文章不是說，語句更新會生成undo log（回滾日志）嗎？那么，undo log在哪呢？

實際上，圖2中的三個虛線箭頭，就是undo log；而V1、V2、V3並不是物理上真實存在的，而是每次需要的時候根據當前版本和undo log計算出來的。比如，需要V2的時候，就是通過V4依次執行U3、U2算出來。

明白了多版本和row trx_id的概念后，我們再來想一下，InnoDB是怎么定義那個“100G”的快照的。

按照可重復讀的定義，一個事務啟動的時候，能夠看到所有已經提交的事務結果。但是之后，這個事務執行期間，其他事務的更新對它不可見。

因此，一個事務只需要在啟動的時候聲明說，“以我啟動的時刻為准，如果一個數據版本是在我啟動之前生成的，就認；如果是我啟動以后才生成的，我就不認，我必須要找到它的上一個版本”。

當然，如果“上一個版本”也不可見，那就得繼續往前找。還有，如果是這個事務自己更新的數據，它自己還是要認的。

在實現上， InnoDB為每個事務構造了一個數組，用來保存這個事務啟動瞬間，當前正在“活躍”的所有事務ID。“活躍”指的就是，啟動了但還沒提交。

數組里面事務ID的最小值記為低水位，當前系統里面已經創建過的事務ID的最大值加1記為高水位。

這個視圖數組和高水位，就組成了當前事務的一致性視圖（read-view）。

而數據版本的可見性規則，就是基於數據的row trx_id和這個一致性視圖的對比結果得到的。

這個視圖數組把所有的row trx_id 分成了幾種不同的情況。

圖3 數據版本可見性規則

這樣，對於當前事務的啟動瞬間來說，一個數據版本的row trx_id，有以下幾種可能：

如果落在綠色部分，表示這個版本是已提交的事務或者是當前事務自己生成的，這個數據是可見的；
如果落在紅色部分，表示這個版本是由將來啟動的事務生成的，是肯定不可見的；
如果落在黃色部分，那就包括兩種情況
a. 若 row trx_id在數組中，表示這個版本是由還沒提交的事務生成的，不可見；
b. 若 row trx_id不在數組中，表示這個版本是已經提交了的事務生成的，可見。

比如，對於圖2中的數據來說，如果有一個事務，它的低水位是18，那么當它訪問這一行數據時，就會從V4通過U3計算出V3，所以在它看來，這一行的值是11。

你看，有了這個聲明后，系統里面隨后發生的更新，是不是就跟這個事務看到的內容無關了呢？因為之后的更新，生成的版本一定屬於上面的2或者3(a)的情況，而對它來說，這些新的數據版本是不存在的，所以這個事務的快照，就是“靜態”的了。

所以你現在知道了，InnoDB利用了“所有數據都有多個版本”的這個特性，實現了“秒級創建快照”的能力。

接下來，我們繼續看一下圖1中的三個事務，分析下事務A的語句返回的結果，為什么是k=1。

這里，我們不妨做如下假設：

事務A開始前，系統里面只有一個活躍事務ID是99；
事務A、B、C的版本號分別是100、101、102，且當前系統里只有這四個事務；
三個事務開始前，(1,1）這一行數據的row trx_id是90。

這樣，事務A的視圖數組就是[99,100], 事務B的視圖數組是[99,100,101], 事務C的視圖數組是[99,100,101,102]。

為了簡化分析，我先把其他干擾語句去掉，只畫出跟事務A查詢邏輯有關的操作：

圖4 事務A查詢數據邏輯圖

從圖中可以看到，第一個有效更新是事務C，把數據從(1,1)改成了(1,2)。這時候，這個數據的最新版本的row trx_id是102，而90這個版本已經成為了歷史版本。

第二個有效更新是事務B，把數據從(1,2)改成了(1,3)。這時候，這個數據的最新版本（即row trx_id）是101，而102又成為了歷史版本。

你可能注意到了，在事務A查詢的時候，其實事務B還沒有提交，但是它生成的(1,3)這個版本已經變成當前版本了。但這個版本對事務A必須是不可見的，否則就變成臟讀了。

好，現在事務A要來讀數據了，它的視圖數組是[99,100]。當然了，讀數據都是從當前版本讀起的。所以，事務A查詢語句的讀數據流程是這樣的：

找到(1,3)的時候，判斷出row trx_id=101，比高水位大，處於紅色區域，不可見；
接着，找到上一個歷史版本，一看row trx_id=102，比高水位大，處於紅色區域，不可見；
再往前找，終於找到了（1,1)，它的row trx_id=90，比低水位小，處於綠色區域，可見。

這樣執行下來，雖然期間這一行數據被修改過，但是事務A不論在什么時候查詢，看到這行數據的結果都是一致的，所以我們稱之為一致性讀。

這個判斷規則是從代碼邏輯直接轉譯過來的，但是正如你所見，用於人肉分析可見性很麻煩。

所以，我來給你翻譯一下。一個數據版本，對於一個事務視圖來說，除了自己的更新總是可見以外，有三種情況：

版本未提交，不可見；
版本已提交，但是是在視圖創建后提交的，不可見；
版本已提交，而且是在視圖創建前提交的，可見。

現在，我們用這個規則來判斷圖4中的查詢結果，事務A的查詢語句的視圖數組是在事務A啟動的時候生成的，這時候：

(1,3)還沒提交，屬於情況1，不可見；
(1,2)雖然提交了，但是是在視圖數組創建之后提交的，屬於情況2，不可見；
(1,1)是在視圖數組創建之前提交的，可見。

你看，去掉數字對比后，只用時間先后順序來判斷，分析起來是不是輕松多了。所以，后面我們就都用這個規則來分析。

更新邏輯

細心的同學可能有疑問了：事務B的update語句，如果按照一致性讀，好像結果不對哦？

你看圖5中，事務B的視圖數組是先生成的，之后事務C才提交，不是應該看不見(1,2)嗎，怎么能算出(1,3)來？

圖5 事務B更新邏輯圖

是的，如果事務B在更新之前查詢一次數據，這個查詢返回的k的值確實是1。

但是，當它要去更新數據的時候，就不能再在歷史版本上更新了，否則事務C的更新就丟失了。因此，事務B此時的set k=k+1是在（1,2）的基礎上進行的操作。

所以，這里就用到了這樣一條規則：更新數據都是先讀后寫的，而這個讀，只能讀當前的值，稱為“當前讀”（current read）。

因此，在更新的時候，當前讀拿到的數據是(1,2)，更新后生成了新版本的數據(1,3)，這個新版本的row trx_id是101。

所以，在執行事務B查詢語句的時候，一看自己的版本號是101，最新數據的版本號也是101，是自己的更新，可以直接使用，所以查詢得到的k的值是3。

這里我們提到了一個概念，叫作當前讀。其實，除了update語句外，select語句如果加鎖，也是當前讀。

所以，如果把事務A的查詢語句select * from t where id=1修改一下，加上lock in share mode 或 for update，也都可以讀到版本號是101的數據，返回的k的值是3。下面這兩個select語句，就是分別加了讀鎖（S鎖，共享鎖）和寫鎖（X鎖，排他鎖）。

mysql> select k from t where id=1 lock in share mode;
mysql> select k from t where id=1 for update;

再往前一步，假設事務C不是馬上提交的，而是變成了下面的事務C’，會怎么樣呢？

圖6 事務A、B、C'的執行流程

事務C’的不同是，更新后並沒有馬上提交，在它提交前，事務B的更新語句先發起了。前面說過了，雖然事務C’還沒提交，但是(1,2)這個版本也已經生成了，並且是當前的最新版本。那么，事務B的更新語句會怎么處理呢？

這時候，我們在上一篇文章中提到的“兩階段鎖協議”就要上場了。事務C’沒提交，也就是說(1,2)這個版本上的寫鎖還沒釋放。而事務B是當前讀，必須要讀最新版本，而且必須加鎖，因此就被鎖住了，必須等到事務C’釋放這個鎖，才能繼續它的當前讀。

圖7 事務B更新邏輯圖（配合事務C'）

到這里，我們把一致性讀、當前讀和行鎖就串起來了。

現在，我們再回到文章開頭的問題：事務的可重復讀的能力是怎么實現的？

可重復讀的核心就是一致性讀（consistent read）；而事務更新數據的時候，只能用當前讀。如果當前的記錄的行鎖被其他事務占用的話，就需要進入鎖等待。

而讀提交的邏輯和可重復讀的邏輯類似，它們最主要的區別是：

在可重復讀隔離級別下，只需要在事務開始的時候創建一致性視圖，之后事務里的其他查詢都共用這個一致性視圖；
在讀提交隔離級別下，每一個語句執行前都會重新算出一個新的視圖。

那么，我們再看一下，在讀提交隔離級別下，事務A和事務B的查詢語句查到的k，分別應該是多少呢？

這里需要說明一下，“start transaction with consistent snapshot; ”的意思是從這個語句開始，創建一個持續整個事務的一致性快照。所以，在讀提交隔離級別下，這個用法就沒意義了，等效於普通的start transaction。

下面是讀提交時的狀態圖，可以看到這兩個查詢語句的創建視圖數組的時機發生了變化，就是圖中的read view框。（注意：這里，我們用的還是事務C的邏輯直接提交，而不是事務C’）

圖8 讀提交隔離級別下的事務狀態圖

這時，事務A的查詢語句的視圖數組是在執行這個語句的時候創建的，時序上(1,2)、(1,3)的生成時間都在創建這個視圖數組的時刻之前。但是，在這個時刻：

(1,3)還沒提交，屬於情況1，不可見；
(1,2)提交了，屬於情況3，可見。

所以，這時候事務A查詢語句返回的是k=2。

顯然地，事務B查詢結果k=3。

小結

InnoDB的行數據有多個版本，每個數據版本有自己的row trx_id，每個事務或者語句有自己的一致性視圖。普通查詢語句是一致性讀，一致性讀會根據row trx_id和一致性視圖確定數據版本的可見性。

對於可重復讀，查詢只承認在事務啟動前就已經提交完成的數據；
對於讀提交，查詢只承認在語句啟動前就已經提交完成的數據；

而當前讀，總是讀取已經提交完成的最新版本。

你也可以想一下，為什么表結構不支持“可重復讀”？這是因為表結構沒有對應的行數據，也沒有row trx_id，因此只能遵循當前讀的邏輯。

當然，MySQL 8.0已經可以把表結構放在InnoDB字典里了，也許以后會支持表結構的可重復讀。

又到思考題時間了。我用下面的表結構和初始化語句作為試驗環境，事務隔離級別是可重復讀。現在，我要把所有“字段c和id值相等的行”的c值清零，但是卻發現了一個“詭異”的、改不掉的情況。請你構造出這種情況，並說明其原理。

mysql> CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `c` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB;
insert into t(id, c) values(1,1),(2,2),(3,3),(4,4);

復現出來以后，請你再思考一下，在實際的業務開發中有沒有可能碰到這種情況？你的應用代碼會不會掉進這個“坑”里，你又是怎么解決的呢？

你可以把你的思考和觀點寫在留言區里，我會在下一篇文章的末尾和你討論這個問題。感謝你的收聽，也歡迎你把這篇文章分享給更多的朋友一起閱讀。

上期問題時間

我在上一篇文章最后，留給你的問題是：怎么刪除表的前10000行。比較多的留言都選擇了第二種方式，即：在一個連接中循環執行20次 delete from T limit 500。

確實是這樣的，第二種方式是相對較好的。

第一種方式（即：直接執行delete from T limit 10000）里面，單個語句占用時間長，鎖的時間也比較長；而且大事務還會導致主從延遲。

第三種方式（即：在20個連接中同時執行delete from T limit 500），會人為造成鎖沖突。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 08 | 事務到底是隔離的還是不隔離的？極客時間-MySQL實戰45講(基礎篇) 極客時間-MySQL實戰45講(實踐篇)-1 MySQL實戰45講《MySQL實戰45講》(8-15)筆記《MySQL實戰45講》(1-7)筆記極客時間：操作系統實戰45講【Database】MySQL實戰45講 MySQL實戰45講學習筆記：第一講 MySQL實戰45講學習筆記：第二講

極客時間 mysql實戰45講下載讀 08講事務到底是隔離的還是不隔離的 筆記