在Oracle數據庫中,undo主要有三大作用:提供一致性讀(Consistent Read)、回滾事務(Rollback
Transaction)以及實例恢復(Instance Recovery)。
一致性讀是相對於臟讀(Dirty
Read)而言的。假設某個表T中有10000條記錄,獲取所有記錄需要15分鍾時間。當前時間為9點整,某用戶A發出一條查詢語句:select * from
T,該語句在9點15分時執行完畢。當用戶A執行該SQL語句到9點10分的時候,另外一個用戶B發出了一條delete命令,將T表中的最后一條記錄刪除並提交了。那么到9點15分時,A用戶將返回多少條記錄?
如果返回9999條記錄,則說明發生了臟讀;如果仍然返回10000條記錄,則說明發生了一致性讀。很明顯,在
9點鍾那個時間點發出查詢語句時,表T中確實有10000條記錄,只不過由於I/O的相對較慢,所以才會花15分鍾完成所有記錄的檢索。對於Oracle
數據庫來說,沒有辦法實現臟讀,必須提供一致性讀,並且該一致性讀是在沒有阻塞用戶的DML的前提下實現的。
那么undo數據是如何實現一致性讀的呢?還是針對上面的例子。用戶A在9點發出查詢語句時,服務器進程會將9
點那個時間點上的SCN號記錄下來,假設該SCN號為SCN9.00。那么9點整的時刻的SCN9.00一定大於等於記錄在所有數據塊頭部的ITL槽中的
SCN號(如果有多個ITL槽,則為其中最大的那個SCN號)。
注:
ITL(Interested Transaction
List)是Oracle數據塊內部的一個組成部分,用來記錄該塊所有發生的事務,一個itl可以看作是一個記錄,在一個時間,可以記錄一個事務(包括提交或者未提交事務)。當然,如果這個事務已經提交,那么這個itl的位置就可以被反復使用了,因為itl類似記錄,所以,有的時候也叫itl槽位。
服務器進程在掃描表T的數據塊時,會把掃描到的數據塊頭部的ITL槽中的SCN號與SCN9:00之間進行比較,哪個更大。如果數據塊頭部的SCN號比SCN9.00要小,則說明該數據塊在9點以后沒有被更新,可以直接讀取其中的數據;否則,如果數據塊ITL槽的SCN號比SCN9.00要大,則說明該數據塊在9點以后被更新了,該塊里的數據已經不是9點那個時間點的數據了,於是要借助undo塊。
9點10分,B用戶更新了表T的最后一條記錄並提交(注意,在這里,提交或者不提交並不是關鍵,只要用戶B更新了表T,用戶A就會去讀undo數據塊)。假設被更新記錄屬於N號數據塊。那么這個時候N號數據塊頭部的ITL槽的SCN號就被改為SCN9.10。當服務器進程掃描到被更新的數據塊(也就是N號塊)時,發現其ITL槽中的SCN9.10大於發出查詢時的SCN9.00,說明該數據塊在9點以后被更新了。於是服務器進程到N號塊的頭部,找到SCN9.10所在的ITL槽。由於ITL槽中記錄了對應的undo塊的地址,於是根據該地址找到undo塊,將
undo塊中的被修改前的數據取出,再結合N號塊里的數據行,從而構建出9點10分被更新之前的那個時間點的數據塊內容,這樣的數據塊叫做CR塊(Consistent
Read)。對於delete來說,其undo信息就是insert,也就是說該構建出來的CR塊中就插入了被刪除的那條記錄。隨后,服務器進程掃描該
CR塊,從而返回正確的10000條記錄。
讓我們繼續把問題復雜化。假設在9點10分B用戶刪除了最后一條記錄並提交以后,緊跟着9點11分,C用戶在同一個數據塊里(也就是N號塊)插入了2條記錄。這個時候Oracle又是如何實現一致性讀的呢(假設表T的initrans為1,也就是只有一個ITL
槽)?因為我們已經知道,事務需要使用ITL槽,只要該事務提交或回滾,該ITL槽就能夠被重用。換句話說,該ITL槽里記錄的已經是SCN9.11,而不是SCN9.10了。這時,ITL槽被覆蓋了,Oracle的服務器進程又怎能找回最初的數據呢?
其中的秘密就在於,Oracle在記錄undo數據的時候,不僅記錄了改變前的數據,還記錄了改變前的數據所在的數據塊頭部的ITL信息。因此,9點10分B用戶刪除記錄時(位於N號塊里,並假設該N號塊的ITL信息為[Undo_block0
/
SCN8.50]),則Oracle會將改變前的數據(也就是insert)放到undo塊(假設該undo塊地址為Undo_block1)里,同時在該undo塊里記錄刪除前ITL槽的信息(也就是[Undo_block0
/ SCN8.50])。刪除記錄以后,該N號塊的ITL信息變為 [Undo_block1 /
SCN9.10];到了9點11分,C用戶又在N號塊里插入了兩條記錄,則Oracle將插入前的數據(也就是delete兩條記錄)放到undo塊(假設該undo塊的地址為Undo_block2)里,並將9點11分時的ITL槽的信息(也就是[Undo_block1
/ SCN9.10])也記錄到該undo塊里。插入兩條記錄以后,該N號塊的ITL槽的信息改為 [Undo_block2 /
SCN9.11]。
那么當執行查詢的服務器進程掃描到N號塊時,發現SCN9.11大於SCN9.00,於是到ITL槽中指定的
Undo_block2處找到該undo塊。發現該undo塊里記錄的ITL信息為[Undo_block1 /
SCN9.10],其中的SCN9.10仍然大於SCN9.00,於是服務器進程繼續根據ITL中記錄的Undo_block1,找到該undo塊。發現該undo塊里記錄的ITL信息為[Undo_block0
/
SCN8.50],這時ITL里的SCN8.50小於發出查詢時的SCN9.00,說明這時undo塊包含合適的undo信息,於是服務器進程不再找下去,而是將N號塊、Undo_block2以及Undo_block1的數據結合起來,構建CR塊。將當前N號的數據復制到CR塊里,然后在CR塊里先回退9點11分的事務,也就是在CR塊里刪除兩條記錄,然后再回退9點10分的事務,也就是在CR塊里插入被刪除的記錄,從而構建出9點鍾時的數據。
Oracle就是這樣,以層層嵌套的方式,查找整個undo塊的鏈表,直到發現ITL槽里的SCN號小於等於發出查詢時的那個SCN號為止。正常來說,當前undo塊里記錄的SCN號要比上一個undo塊里記錄的SCN號要小。
但是在查找的過程中,可能會發現當前undo塊里記錄的ITL槽的SCN號比上一個undo塊里記錄的SCN號還要大。這種情況說明由於事務被提交或回滾,導致當前找到的undo塊里的數據已經被其他事務覆蓋了,於是我們無法再找出小於等於發出查詢時的那個時間點的SCN號,這時Oracle就會拋出一個非常經典的錯誤——ORA-1555,也就是snapshot
too old的錯誤。
以上的描述可以用圖來描述:
回滾事務則是在執行DML以后,發出rollback命令撤銷DML所作的變化。Oracle利用記錄在ITL槽里記錄的undo
塊的地址找到該undo塊,然后從中取出變化前的值,並放入數據塊中,從而對事務所作的變化進行回滾。
實例恢復則是在SMON進程完成前滾並打開數據庫以后發生。SMON進程會去查看undo
segment頭部(所謂頭部就是undo segment里的第一個數據塊)記錄的事務表(每個事務在使用undo塊時,首先要在該undo塊所在的undo
segment的頭部記錄一個條目,該條目里記錄了該事務相關的信息,其中包括是否提交等),將其中既沒有提交也沒有回滾,而是在實例崩潰時被異常終止的事務全部回滾。