Oracle之數據庫一致性讀的原理

本文轉載自查看原文 2012-05-09 17:53 12528 Oracle編程之旅

在Oracle數據庫中，undo主要有三大作用：提供一致性讀（Consistent Read）、回滾事務（Rollback
Transaction）以及實例恢復（Instance Recovery）。

一致性讀是相對於臟讀（Dirty
Read）而言的。假設某個表T中有10000條記錄，獲取所有記錄需要15分鍾時間。當前時間為9點整，某用戶A發出一條查詢語句：select * from
T，該語句在9點15分時執行完畢。當用戶A執行該SQL語句到9點10分的時候，另外一個用戶B發出了一條delete命令，將T表中的最后一條記錄刪除並提交了。那么到9點15分時，A用戶將返回多少條記錄？

如果返回9999條記錄，則說明發生了臟讀；如果仍然返回10000條記錄，則說明發生了一致性讀。很明顯，在
9點鍾那個時間點發出查詢語句時，表T中確實有10000條記錄，只不過由於I/O的相對較慢，所以才會花15分鍾完成所有記錄的檢索。對於Oracle
數據庫來說，沒有辦法實現臟讀，必須提供一致性讀，並且該一致性讀是在沒有阻塞用戶的DML的前提下實現的。

那么undo數據是如何實現一致性讀的呢？還是針對上面的例子。用戶A在9點發出查詢語句時，服務器進程會將9
點那個時間點上的SCN號記錄下來，假設該SCN號為SCN9.00。那么9點整的時刻的SCN9.00一定大於等於記錄在所有數據塊頭部的ITL槽中的
SCN號（如果有多個ITL槽，則為其中最大的那個SCN號）。

注:
ITL（Interested Transaction
List）是Oracle數據塊內部的一個組成部分，用來記錄該塊所有發生的事務，一個itl可以看作是一個記錄，在一個時間，可以記錄一個事務（包括提交或者未提交事務）。當然，如果這個事務已經提交，那么這個itl的位置就可以被反復使用了，因為itl類似記錄，所以，有的時候也叫itl槽位。

服務器進程在掃描表T的數據塊時，會把掃描到的數據塊頭部的ITL槽中的SCN號與SCN9:00之間進行比較，哪個更大。如果數據塊頭部的SCN號比SCN9.00要小，則說明該數據塊在9點以后沒有被更新，可以直接讀取其中的數據；否則，如果數據塊ITL槽的SCN號比SCN9.00要大，則說明該數據塊在9點以后被更新了，該塊里的數據已經不是9點那個時間點的數據了，於是要借助undo塊。

9點10分，B用戶更新了表T的最后一條記錄並提交（注意，在這里，提交或者不提交並不是關鍵，只要用戶B更新了表T，用戶A就會去讀undo數據塊）。假設被更新記錄屬於N號數據塊。那么這個時候N號數據塊頭部的ITL槽的SCN號就被改為SCN9.10。當服務器進程掃描到被更新的數據塊（也就是N號塊）時，發現其ITL槽中的SCN9.10大於發出查詢時的SCN9.00，說明該數據塊在9點以后被更新了。於是服務器進程到N號塊的頭部，找到SCN9.10所在的ITL槽。由於ITL槽中記錄了對應的undo塊的地址，於是根據該地址找到undo塊，將
undo塊中的被修改前的數據取出，再結合N號塊里的數據行，從而構建出9點10分被更新之前的那個時間點的數據塊內容，這樣的數據塊叫做CR塊（Consistent
Read）。對於delete來說，其undo信息就是insert，也就是說該構建出來的CR塊中就插入了被刪除的那條記錄。隨后，服務器進程掃描該
CR塊，從而返回正確的10000條記錄。

讓我們繼續把問題復雜化。假設在9點10分B用戶刪除了最后一條記錄並提交以后，緊跟着9點11分，C用戶在同一個數據塊里（也就是N號塊）插入了2條記錄。這個時候Oracle又是如何實現一致性讀的呢（假設表T的initrans為1，也就是只有一個ITL
槽）？因為我們已經知道，事務需要使用ITL槽，只要該事務提交或回滾，該ITL槽就能夠被重用。換句話說，該ITL槽里記錄的已經是SCN9.11，而不是SCN9.10了。這時，ITL槽被覆蓋了，Oracle的服務器進程又怎能找回最初的數據呢？

其中的秘密就在於，Oracle在記錄undo數據的時候，不僅記錄了改變前的數據，還記錄了改變前的數據所在的數據塊頭部的ITL信息。因此，9點10分B用戶刪除記錄時（位於N號塊里，並假設該N號塊的ITL信息為[Undo_block0
/
SCN8.50]），則Oracle會將改變前的數據（也就是insert）放到undo塊（假設該undo塊地址為Undo_block1）里，同時在該undo塊里記錄刪除前ITL槽的信息（也就是[Undo_block0
/ SCN8.50]）。刪除記錄以后，該N號塊的ITL信息變為 [Undo_block1 /
SCN9.10]；到了9點11分，C用戶又在N號塊里插入了兩條記錄，則Oracle將插入前的數據（也就是delete兩條記錄）放到undo塊（假設該undo塊的地址為Undo_block2）里，並將9點11分時的ITL槽的信息（也就是[Undo_block1
/ SCN9.10]）也記錄到該undo塊里。插入兩條記錄以后，該N號塊的ITL槽的信息改為 [Undo_block2 /
SCN9.11]。

那么當執行查詢的服務器進程掃描到N號塊時，發現SCN9.11大於SCN9.00，於是到ITL槽中指定的
Undo_block2處找到該undo塊。發現該undo塊里記錄的ITL信息為[Undo_block1 /
SCN9.10]，其中的SCN9.10仍然大於SCN9.00，於是服務器進程繼續根據ITL中記錄的Undo_block1，找到該undo塊。發現該undo塊里記錄的ITL信息為[Undo_block0
/
SCN8.50]，這時ITL里的SCN8.50小於發出查詢時的SCN9.00，說明這時undo塊包含合適的undo信息，於是服務器進程不再找下去，而是將N號塊、Undo_block2以及Undo_block1的數據結合起來，構建CR塊。將當前N號的數據復制到CR塊里，然后在CR塊里先回退9點11分的事務，也就是在CR塊里刪除兩條記錄，然后再回退9點10分的事務，也就是在CR塊里插入被刪除的記錄，從而構建出9點鍾時的數據。
Oracle就是這樣，以層層嵌套的方式，查找整個undo塊的鏈表，直到發現ITL槽里的SCN號小於等於發出查詢時的那個SCN號為止。正常來說，當前undo塊里記錄的SCN號要比上一個undo塊里記錄的SCN號要小。

但是在查找的過程中，可能會發現當前undo塊里記錄的ITL槽的SCN號比上一個undo塊里記錄的SCN號還要大。這種情況說明由於事務被提交或回滾，導致當前找到的undo塊里的數據已經被其他事務覆蓋了，於是我們無法再找出小於等於發出查詢時的那個時間點的SCN號，這時Oracle就會拋出一個非常經典的錯誤——ORA-1555，也就是snapshot
too old的錯誤。

以上的描述可以用圖來描述：

回滾事務則是在執行DML以后，發出rollback命令撤銷DML所作的變化。Oracle利用記錄在ITL槽里記錄的undo
塊的地址找到該undo塊，然后從中取出變化前的值，並放入數據塊中，從而對事務所作的變化進行回滾。

實例恢復則是在SMON進程完成前滾並打開數據庫以后發生。SMON進程會去查看undo
segment頭部（所謂頭部就是undo segment里的第一個數據塊）記錄的事務表（每個事務在使用undo塊時，首先要在該undo塊所在的undo
segment的頭部記錄一個條目，該條目里記錄了該事務相關的信息，其中包括是否提交等），將其中既沒有提交也沒有回滾，而是在實例崩潰時被異常終止的事務全部回滾。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Redis與數據庫數據一致性 52、數據庫如何保證一致性？如何保證緩存和數據庫的一致性數據庫一致性解讀數據庫一致性的理解緩存與數據庫一致性保證數據庫和redis雙寫一致性如何保證緩存和數據庫的一致性？分布式數據庫數據一致性的原理、與技術實現方案【數據庫學習】數據庫的ACID（原子性、一致性、隔離性與持久性）