全網最全一篇MySQL數據庫MVCC詳解,不全你打我


什么是MVCC

全稱Multi-Version Concurrency Control,即多版本並發控制,主要是為了提高數據庫的並發性能。以下文章都是圍繞InnoDB引擎來講,因為myIsam不支持事務。

同一行數據平時發生讀寫請求時,會上鎖阻塞住。但mvcc用更好的方式去處理讀—寫請求,做到在發生讀—寫請求沖突時不用加鎖

這個讀是指的快照讀,而不是當前讀,當前讀是一種加鎖操作,是悲觀鎖

那它到底是怎么做到讀—寫不用加鎖的,快照讀當前讀又是什么鬼,跟着你們的貼心老哥,繼續往下看。

當前讀、快照讀都是什么鬼

什么是MySQL InnoDB下的當前讀和快照讀?

當前讀

它讀取的數據庫記錄,都是當前最新版本,會對當前讀取的數據進行加鎖,防止其他事務修改數據。是悲觀鎖的一種操作。

如下操作都是當前讀:

  • select lock in share mode (共享鎖)

  • select for update (排他鎖)

  • update (排他鎖)

  • insert (排他鎖)

  • delete (排他鎖)

  • 串行化事務隔離級別

快照讀

快照讀的實現是基於多版本並發控制,即MVCC,既然是多版本,那么快照讀讀到的數據不一定是當前最新的數據,有可能是之前歷史版本的數據。

如下操作是快照讀:

  • 不加鎖的select操作(注:事務級別不是串行化)

快照讀與mvcc的關系

MVCCC是“維持一個數據的多個版本,使讀寫操作沒有沖突”的一個抽象概念

這個概念需要具體功能去實現,這個具體實現就是快照讀。(具體實現下面講)

聽完貼心老哥的講解,是不是瞬間茅廁頓開

數據庫並發場景

  • 讀-讀:不存在任何問題,也不需要並發控制

  • 讀-寫:有線程安全問題,可能會造成事務隔離性問題,可能遇到臟讀,幻讀,不可重復讀

  • 寫-寫:有線程安全問題,可能會存在更新丟失問題,比如第一類更新丟失,第二類更新丟失

MVCC解決並發哪些問題?

mvcc用來解決讀—寫沖突的無鎖並發控制,就是為事務分配單向增長時間戳。為每個數據修改保存一個版本,版本與事務時間戳相關聯

讀操作只讀取該事務開始前數據庫快照

解決問題如下:

  • 並發讀-寫時:可以做到讀操作不阻塞寫操作,同時寫操作也不會阻塞讀操作。

  • 解決臟讀幻讀不可重復讀等事務隔離問題,但不能解決上面的寫-寫 更新丟失問題。

因此有了下面提高並發性能的組合拳

  • MVCC + 悲觀鎖:MVCC解決讀寫沖突,悲觀鎖解決寫寫沖突

  • MVCC + 樂觀鎖:MVCC解決讀寫沖突,樂觀鎖解決寫寫沖突

MVCC的實現原理

它的實現原理主要是版本鏈undo日志Read View 來實現的

版本鏈

我們數據庫中的每行數據,除了我們肉眼看見的數據,還有幾個隱藏字段,得開天眼才能看到。分別是db_trx_iddb_roll_pointerdb_row_id

  • db_trx_id

    6byte,最近修改(修改/插入)事務ID:記錄創建這條記錄/最后一次修改該記錄的事務ID

  • db_roll_pointer(版本鏈關鍵)

    7byte,回滾指針,指向這條記錄上一個版本(存儲於rollback segment里)

  • db_row_id

    6byte,隱含的自增ID(隱藏主鍵),如果數據表沒有主鍵,InnoDB會自動以db_row_id產生一個聚簇索引

  • 實際還有一個刪除flag隱藏字段, 記錄被更新刪除並不代表真的刪除,而是刪除flag變了

如上圖,db_row_id是數據庫默認為該行記錄生成的唯一隱式主鍵db_trx_id是當前操作該記錄的事務ID,而db_roll_pointer是一個回滾指針,用於配合undo日志,指向上一個舊版本

每次對數據庫記錄進行改動,都會記錄一條undo日志,每條undo日志也都有一個roll_pointer屬性(INSERT操作對應的undo日志沒有該屬性,因為該記錄並沒有更早的版本),可以將這些undo日志都連起來串成一個鏈表,所以現在的情況就像下圖一樣:

對該記錄每次更新后,都會將舊值放到一條undo日志中,就算是該記錄的一個舊版本,隨着更新次數的增多,所有的版本都會被roll_pointer屬性連接成一個鏈表,我們把這個鏈表稱之為版本鏈,版本鏈的頭節點就是當前記錄最新的值。另外,每個版本中還包含生成該版本時對應的事務id,這個信息很重要,在根據ReadView判斷版本可見性的時候會用到。

undo日志

Undo log 主要用於記錄數據被修改之前的日志,在表信息修改之前先會把數據拷貝到undo log里。

事務進行回滾時可以通過undo log 里的日志進行數據還原

Undo log 的用途

  • 保證事務進行rollback時的原子性和一致性,當事務進行回滾的時候可以用undo log的數據進行恢復

  • 用於MVCC快照讀的數據,在MVCC多版本控制中,通過讀取undo log歷史版本數據可以實現不同事務版本號都擁有自己獨立的快照數據版本

undo log主要分為兩種:

  • insert undo log

    代表事務在insert新記錄時產生的undo log , 只在事務回滾時需要,並且在事務提交后可以被立即丟棄

  • update undo log(主要)

    事務在進行update或delete時產生的undo log ; 不僅在事務回滾時需要,在快照讀時也需要;

    所以不能隨便刪除,只有在快速讀或事務回滾不涉及該日志時,對應的日志才會被purge線程統一清除

Read View(讀視圖)

事務進行快照讀操作的時候生產的讀視圖(Read View),在該事務執行的快照讀的那一刻,會生成數據庫系統當前的一個快照

記錄並維護系統當前活躍事務的ID(沒有commit,當每個事務開啟時,都會被分配一個ID, 這個ID是遞增的,所以越新的事務,ID值越大),是系統中當前不應該被本事務看到的其他事務id列表

Read View主要是用來做可見性判斷的, 即當我們某個事務執行快照讀的時候,對該記錄創建一個Read View讀視圖,把它比作條件用來判斷當前事務能夠看到哪個版本的數據,既可能是當前最新的數據,也有可能是該行記錄的undo log里面的某個版本的數據。

Read View幾個屬性

  • trx_ids: 當前系統活躍(未提交)事務版本號集合。

  • low_limit_id: 創建當前read view 時“當前系統最大事務版本號+1”。

  • up_limit_id: 創建當前read view 時“系統正處於活躍事務最小版本號

  • creator_trx_id: 創建當前read view的事務版本號;

Read View可見性判斷條件

  • db_trx_id < up_limit_id || db_trx_id == creator_trx_id(顯示)

    如果數據事務ID小於read view中的最小活躍事務ID,則可以肯定該數據是在當前事務啟之前就已經存在了的,所以可以顯示

    或者數據的事務ID等於creator_trx_id ,那么說明這個數據就是當前事務自己生成的,自己生成的數據自己當然能看見,所以這種情況下此數據也是可以顯示的。

  • db_trx_id >= low_limit_id(不顯示)

    如果數據事務ID大於read view 中的當前系統的最大事務ID,則說明該數據是在當前read view 創建之后才產生的,所以數據不顯示。如果小於則進入下一個判斷

  • db_trx_id是否在活躍事務(trx_ids)中

    • 不存在:則說明read view產生的時候事務已經commit了,這種情況數據則可以顯示

    • 已存在:則代表我Read View生成時刻,你這個事務還在活躍,還沒有Commit,你修改的數據,我當前事務也是看不見的。

MVCC和事務隔離級別

上面所講的Read View用於支持RC(Read Committed,讀提交)和RR(Repeatable Read,可重復讀)隔離級別實現

RR、RC生成時機

  • RC隔離級別下,是每個快照讀都會生成並獲取最新Read View

  • 而在RR隔離級別下,則是同一個事務中第一個快照讀才會創建Read View, 之后的快照讀獲取的都是同一個Read View,之后的查詢就不會重復生成了,所以一個事務的查詢結果每次都是一樣的

解決幻讀問題

  • 快照讀:通過MVCC來進行控制的,不用加鎖。按照MVCC中規定的“語法”進行增刪改查等操作,以避免幻讀。

  • 當前讀:通過next-key鎖(行鎖+gap鎖)來解決問題的。

RC、RR級別下的InnoDB快照讀區別

  • 在RR級別下的某個事務的對某條記錄的第一次快照讀會創建一個快照及Read View, 將當前系統活躍的其他事務記錄起來,此后在調用快照讀的時候,還是使用的是同一個Read View,所以只要當前事務在其他事務提交更新之前使用過快照讀,那么之后的快照讀使用的都是同一個Read View,所以對之后的修改不可見;

  • 即RR級別下,快照讀生成Read View時,Read View會記錄此時所有其他活動事務的快照,這些事務的修改對於當前事務都是不可見的。而早於Read View創建的事務所做的修改均是可見

  • 而在RC級別下的,事務中,每次快照讀都會新生成一個快照和Read View, 這就是我們在RC級別下的事務中可以看到別的事務提交的更新的原因

總結

從以上的描述中我們可以看出來,所謂的MVCC指的就是在使用READ COMMITTDREPEATABLE READ這兩種隔離級別的事務在執行普通的SEELCT操作時訪問記錄的版本鏈的過程,這樣子可以使不同事務的讀-寫寫-讀操作並發執行,從而提升系統性能

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM