在並發讀寫數據庫時,讀操作可能會不一致的數據(臟讀)。為了避免這種情況,需要實現數據庫的並發訪問控制,最簡單的方式就是加鎖訪問。由於,加鎖會將讀寫操作串行化,所以不會出現不一致的狀態。但是,讀操作會被寫操作阻塞,大幅降低讀性能。在java concurrent包中,有copyonwrite系列的類,專門用於優化讀遠大於寫的情況。而其優化的手段就是,在進行寫操作時,將數據copy一份,不會影響原有數據,然后進行修改,修改完成后原子替換掉舊的數據,而讀操作只會讀取原有數據。通過這種方式實現寫操作不會阻塞讀操作,從而優化讀效率。而寫操作之間是要互斥的,並且每次寫操作都會有一次copy,所以只適合讀大於寫的情況。
MVCC的原理與copyonwrite類似,全稱是Multi-Version Concurrent Control,即多版本並發控制。在MVCC協議下,每個讀操作會看到一個一致性的snapshot,並且可以實現非阻塞的讀。MVCC允許數據具有多個版本,這個版本可以是時間戳或者是全局遞增的事務ID,在同一個時間點,不同的事務看到的數據是不同的。
實現原理:
------------------------------------------------------------------------------------------> 時間軸
|-------R(T1)-----|
|-----------U(T2)-----------|
如上圖,假設有兩個並發操作R(T1)和U(T2),T1和T2是事務ID,T1小於T2,系統中包含數據a = 1(T1),R和W的操作如下:
R:read a (T1)
U:a = 2 (T2)
R(讀操作)的版本T1表示要讀取數據的版本,而之后寫操作才會更新版本,讀操作不會。在時間軸上,R晚於U,而由於U在R開始之后提交,所以對於R是不可見的。所以,R只會讀取T1版本的數據,即a = 1。
由於在update操作提交之前,不能影響已有數據的一致性,所以不會改變舊的數據,update操作會被拆分成insert + delete。需要標記刪除舊的數據,insert新的數據。只有update提交之后,才會影響后續的讀操作。而對於讀操作而且,只能讀到在其之前的所有的寫操作,正在執行中的寫操作對其是不可見的。
上面說了一堆的虛的理論,下面來點干活,看一下mysql的innodb引擎是如何實現MVCC的。innodb會為每一行添加兩個字段,分別表示該行創建的版本和刪除的版本,填入的是事務的版本號,這個版本號隨着事務的創建不斷遞增。innodb MVCC主要是為Repeatable-Read事務隔離級別做的。在此隔離級別下,A、B客戶端所示的數據相互隔離,互相更新不可見,在Repeatable-Read的隔離級別下,具體各種數據庫操作的實現:
SELECT
InnoDB會根據以下兩個條件檢查每行記錄:
1、InnoDB只查找版本小於或等於當前事務版本的數據行,這樣可以確保事務讀取的行,是在事務開始前就已經存在的,或者是事務自身插入或者修改過的數據。
2、行的刪除版本要么未定義,要么大於當前事務的版本。這可以確保事務讀取到的行,在事務開始前未被刪除。
只有符合上述兩個條件的記錄,才能返回做為查詢結果。
INSERT
InnoDB為新插入的每一行保存當前系統版本號作為行版本號。
DELETE
InnoDB為刪除的每一行保存當前系統版本號作為行刪除標識。
UPDATE
InnoDB為插入一行新記錄,保存當前系統版本號作為行版本號,同時保存當前系統版本號到原來的行作為刪除標識。
其中,寫操作(insert、delete和update)執行時,需要將系統版本號遞增。
由於舊數據並不真正的刪除,所以必須對這些數據進行清理,innodb會開啟一個后台線程執行清理工作,具體的規則是將刪除版本號小於當前系統版本的行刪除,這個過程叫做purge。
通過MVCC很好的實現了事務的隔離性,可以達到repeated read級別,要實現serializable還必須加鎖。
優缺點:
保存這兩個額外的系統版本號,使大多數讀操作都可以不用加鎖。這樣設計使得讀數據操作很簡單,性能很好。並且也能保證只會讀取到符合標准的行。不足之處是每行記錄都需要額外的存儲空間,需要做更多的檢查工作,以及一些額外的維護工作。
innodb 和postgre實現:
- postgres 是嚴格地無鎖,對寫操作也是樂觀並發控制;在表中保存同一行數據記錄的多個不同版本,每次寫操作,都是創建,而回避更新;在事務提交時,按版本號檢查當前事務提交的數據是否存在寫沖突,則拋異常告知用戶,回滾事務;
- innodb 則只對讀無鎖,寫操作仍是上鎖的悲觀並發控制,這也意味着,innodb 中只能見到因死鎖和不變性約束而回滾,而見不到因為寫沖突而回滾;不像 postgres 那樣對數據修改在表中創建新紀錄,而是每行數據只在表中保留一份,在更新數據時上行鎖,同時將舊版數據寫入 undo log;表和 undo log 中行數據都記錄着事務ID,在檢索時,只讀取來自當前已提交的事務的行數據;