MySQL InnoDB MVCC

MVCC（Multiversion concurrency control）：多版本並發控制，並發訪問（讀或寫）數據庫時，對正在事務內處理的數據做多版本的管理。以達到用來避免寫操作的堵塞，從而引發讀操作的並發問題。

MVCC 邏輯流程

插入

MySQL 在每一行數據中都會默認添加一些隱藏列 DB_TRX_ID、DB_ROLL_PT。

思考：如果事務是自動提交的（SET AUTOCOMMIT = NO），且未手動開啟事務，執行如下兩條 SQL，插入的數據會是什么樣子的？

因為事務是自動提交的，所以兩條插入語句會分別獲取事務ID，所以這里插入的數據行的版本號是1和2。

刪除

修改

查詢

案例分析

案例一

雖然在執行 3,4 步驟的時候更新 id=1 的數據，但是根據 MVCC 的查詢邏輯流程，再次執行2，獲取到的數據依然和第一次一樣。

案例二

根據 MVCC 的查詢邏輯流程，執行1,2，獲取到的數據是事務B未提交的數據，這個是有問題的。

分析了案例一和案例二，發現 MVCC 不能解決案例二的問題，InnoDB 會使用 Undo log 解決案例二的問題。

Undo Log

Undo Log 的定義

Undo：意為取消，以撤銷操作為目的，返回指定某個狀態的操作。

Undo Log：數據庫事務提交之前，會將事務修改數據的鏡像（即修改前的舊版本）存放到 undo 日志里，當事務回滾時，或者數據庫奔潰時，可以利用 undo 日志，即舊版本數據，撤銷未提交事務對數據庫產生的影響。。

當前讀和快照讀

快照讀

SQL 讀取的數據是快照版本，也就是歷史版本，普通的 SELECT 就是快照讀。

InnoDB 快照讀，數據的讀取將由 cache（原本數據）+ Undo Log（事務修改過的數據）兩部分組成。

當前讀

SQL 讀取的數據是最新版本，通過鎖機制來保證讀取的數據無法通過其他事務進行修改。

UPDATE 、DELETE 、INSERT 、SELECT … LOCK IN SHARE MODE 、SELECT … FOR UPDATE 都是當前讀，這些操作在《MySQL InnoDB 鎖》這篇文章中有過演示，事務A執行這些 SQL，會阻塞事務B的 SQL 執行。

在 InnoDB 引擎里面，快照讀通過 MVCC 解決幻讀的問題，當前讀通過 Next-Key Locks 解決幻讀的問題。

Redo Log

Redo Log 的定義

Redo：顧名思義就是重做。以恢復操作為目的，重現操作。

Redo Log：指事務中操作的任何數據，將最新的數據備份到一個地方（Redo Log）。

Redo Log 的持久化：不是隨着事務的提交才寫入的，而是在事務的執行過程中，便開始寫入 Redo Log 中，具體的落盤策略可以進行配置。

Redo Log 實現事務持久性：防止在發生故障的時間點，尚有臟頁未寫入表的 IBD 文件中，在重啟 MySQL 服務的時候，根據 Redo Log 進行重做，從而達到事務的未入磁盤數據進行持久化這一特性。

InnoDB 不是每一次提交事務都把數據從緩存區持久化到硬盤的，因為每次提交事務都把數據持久化到硬盤，效率很低，每一次持久化都需要執行 IO 操作。

InnoDB 會把每次數據變化會先進入 Redo Buffer 中，事務提交了，會根據策略把新的數據寫入 Redo Log 中，InnoDB 就會認為這次事務提交成功了，數據並不一定馬上就進入表的 IBD 文件中。

疑問：持久化到 Redo Log 中和持久化到表的 IBD 文件一樣都是 IO 操作，為什么要設計 Redo Log 呢？

其實是因為持久化到 Redo Log 中是順序 IO 的操作，而持久化到表的 IBD 文件中是一個隨機 IO 的操作，比如我們需要更新 id=1 和 id=8 的數據，如果是 Redo Log，就只需要把更新的數據順序存入 Redo Log 中；但如果是表的 IBD 文件，就需要先找到 id=1 和 id=8 的兩個不連續的磁盤文件地址，再做持久化操作，影響數據庫服務的並發性能。

Redo Log 的持久化配置

指定 Redo Log 記錄在 {datadir}/ib_logfile1 和 ib_logfile2 兩個文件中，可以通過 innodb_log_group_home_dir配置指定目錄存儲。

一旦事務成功提交且數據持久化到表的 IBD 文件中之后，此時 Redo Log 中的對應事務數據記錄就失去了意義，所以 Redo Log 的寫入是日志文件循環寫入的過程，也就是覆蓋寫的過程。

指定 Redo Log 日志文件組中的數量 innodb_log_files_in_group 默認為2
指定 Redo Log 每一個日志文件最大存儲量 innodb_log_file_size 默認48M
指定 Redo Log 在 cache/buffer 中的 buffer 池大小 innodb_log_buffer_size 默認16M

Redo Buffer 持久化到 Redo Log 的策略，通過設置 Innodb_flush_log_at_trx_commit 的值：

取值0：每秒提交 Redo buffer -> Redo Log OS cache -> flush cache to disk，可能丟失一秒內的事務數據。
取值1（默認值）：每次事務提交執行 Redo Buffer -> Redo Log OS cache -> flush cache to disk，最安全，性能最差的方式
取值2：每次事務提交執行 Redo Buffer -> Redo log OS cache 再每一秒執行 -> flush cache to disk 操作

一般建議選擇取值2，因為 MySQL 掛了最多損失一次事務提交的數據，整個服務期掛了才會損失一秒的事務提交數據。

MVCC

MVCC 的定義