Oracle DataGuard是Oracle自帶的數據同步功能,基本原理是將日志文件從原數據庫傳輸到目標數據庫,然后在目標數據庫上應用這些日志文件,從而使目標數據庫與源數據庫保持同步,是一種數據庫級別的高可用性方案。
DataGuard可以提供Oracle數據庫的冗災、數據保護、故障恢復等,實現數據庫快速切換與災難性恢復。在生產數據庫的保證"事務一致性"時,使用生產庫的物理全備份創建備庫,備庫會通過生產庫傳輸過來的歸檔日志或重做條目自動維護備用數據庫。
DataGuard數據同步技術有以下優勢:
1) Oracle數據庫自身內置的功能,與每個Oracle新版本的新特性都完全兼容,且不需要另外付費。
2) 配置管理較簡單,不需要熟悉其他第三方的軟件產品。
3) 物理Standby數據庫支持任何類型的數據對象和數據類型;
4) 邏輯Standby數據庫處於打開狀態,可以在保持數據同步的同時執行查詢等操作。
5) 在最大保護模式下,可確保數據的零丟失。
一、架構
Oracle DataGuard由一個primary數據庫(生產數據庫)及一個或多個standby數據庫(最多9個)組成。組成Data Guard的數據庫通過Oracle Net連接,並且有可以分布於不同地域。只要各庫之間可以相互通信,它們的物理位置並沒有什么限制,不受操作系統的限制。
1.Primary 數據庫
DataGuard包含一個primary數據庫即被大部分應用訪問的生產數據庫,該庫既可以是 單實例數據庫,也可以是RAC。
2.Standby 數據庫
Standby數據庫是primary數據庫的復制(事務上一致)。在同一個Data Guard中可以最多創建9個standby數據庫。一旦創建完成,Data Guard通過應用primary數據庫的redo自動維護每一個standby數據庫。Standby數據庫同樣即可以是單實例數據庫,也可以是RAC結構。
二、Standby數據庫類型
Standby數據庫通常分兩類:邏輯standby和物理standby。 邏輯standby
邏輯standby是通過接收primary數據庫的redo log並轉換成sql語句,然后在standby數據庫上執行SQL語句實現同步。 物理standby
物理standby是通過接收並應用primary數據庫的redo log以介質恢復的方式實現同步,不僅文件的物理結構相同,連塊在磁盤上的存儲位置都是一模一樣的。
三、服務
重做傳輸服務(Redo Transport Services)
控制redo數據的傳輸到一個或多個歸檔目的地。 日志應用服務(Log Apply Services)
應用redo數據到standby數據庫,以保持與primary數據庫的事務一致。redo數據即可以從standby數據庫的歸檔文件讀取,也可直接應用備用日志文件讀取。 角色轉換服務(Role Transitions)
DataGuard中有兩種角色:primary和standby。角色轉換就是讓數據庫在這兩個角色中切換, 切換分兩種:switchover和failover
1)switchover:轉換primary數據庫與standby數據庫。switchover可以確保不會丟失數據。
2)failover:當primary數據庫出現故障並且不能被及時恢復時,會調用failover將一個standby數據庫轉換為新的primary數據庫。在最大保護模式或最高可用性模式下,failover可以保證不會丟失數據。
四、保護模式
1.最大保護
這種模式是默認的數據保護模式,在不影響源數據庫性能的條件下提供盡可能高的數
據保護等級。在該種模式下,一旦日志數據寫到源數據庫的聯機日志文件,事務即可提交,不必等待日志寫到目標數據庫,如果網絡帶寬充足,該種模式可提供類似於最大可用模式的數據保護等級。
2.最大可用性
這種模式和"最大保護"基本上差不多。正常情況下,主備庫之間是同步的。
當網絡或者備庫出現問題時,不會影響到主庫的當機,主庫會自動轉換庫"最大性能"模式,等待備庫可用時,將歸檔傳輸到備庫做恢復。
3.最大性能
這種模式保證主庫性能最大化,主備庫之間數據是異步傳輸的。即,主備日志歸檔以
后才會傳輸到備用庫
[以上
來源]
1、DATAGUARD原理
DATAGUARD是通過建立一個PRIMARY和STANDBY組來確立其參照關系。
STANDBY一旦創建,DATAGUARD就會通過將主數據庫(PRIMARY)的REDO傳遞給STANDBY數據庫,然后在STANDBY中應用REDO實現數據庫的同步。
有兩種類型的STANDBY:物理STANDBY和邏輯STANDBY
物理STANDBY提供與主數據庫完全一樣的拷貝(塊到塊),數據庫SCHEMA,包括索引都是一樣的。它是直接應用REDO實現同步的。
邏輯STANDBY則不是這樣,在邏輯STANDBY中,邏輯信息是相同的,但物理組織和數據結構可以不同,它和主庫保持同步的方法是將接收的REDO轉換成SQL語句,然后在STANDBY上執行SQL語句。邏輯STANDBY除災難恢復外還有其它用途,比如用於用戶進行查詢和報表。
DATAGUARD包含三個服務(日志傳輸、日志應用、角色轉換)
日志傳輸服務控制REDO數據的傳輸(傳輸日志,實施數據庫保護模式)--------------STANDBY上通過起用RFS進程接收REDO數據。
日志應用服務則一方面自動應用日志,另一方面自動檢測STANDBY缺少的REDO,並從主數據庫或其它STANDBY中自動查詢出丟失的REDO。
DATAGUARD的幾種保護模式:最大保護,最大可用,最大性能
最大保護是指除非REDO在至少一個STANDBY中可用,否則事務不能提交。如果在某個STANDBY中不可用,則主數據庫的操作被停止。通常受制約比較多,在生產環境中不是很常用(性價比不好)。
最大可用是指如果STANDBY不可用,主數據庫仍然可以處理事務,只是在問題被糾正后,STANDBY和主數據庫進行再同步。這樣的一個問題是:當再同步之前有FAILOVER時,有些數據可能會丟失。
最大性能是指主數據庫的提交操作不等待STANDBY。PRIMARY和STANDBY松耦合,數據保護級別較低。
物理STANDBY可能的模式:只讀模式(OPEN READONLY)和恢復模式(MANANGED RECOVERY)
2、物理DATAGUARD實施簡要過程
主數據庫的准備工作:FORCE LOGGING,ENABLE ARCHIVING,一個本地歸檔目的地。
創建STANDBY數據庫:
a.關閉主庫,冷備份主庫數據文件、日志文件和密碼文件,然后啟動主庫,在主庫上創建STANDBY的控制文件:alter database create standby controlfile as '文件名'
b.准備參數文件,將參數文件、備份的主庫文件和STANDBY控制文件拷貝到STANDBY系統。
需要更改的參數有:standby_archive_dest-----接收的歸檔日志存放處
db_file_name_convert和log_file_name_convert-----僅當主庫和STANDBY庫在同一系統下時用
log_archive_dest_1-----本地歸檔目的地
log_archive_dest_2='service=standby'-----歸檔到STANDBY的目的地
standby_file_management=auto
remote_archive_enable=true
fal_server
fal_client
instance_name-----當主庫和STANDBY庫在同一系統下時該參數用於區分主庫
lock_name_space-----當主庫和STANDBY庫在同一系統下時指定STANDBY的實例名和INSTANCE_NAME相同
c.如果是WINDOWS系統,需要創建WINDOWS服務。
d.配置兩台機器的tnsnames.ora,雙方都能tnsping通
e.在主庫和STANDBY庫上配置監聽
f.起用STANDBY系統上的死連接檢測:sqlnet.ora中設置sqlnet.expire_time=2
g.在STANDBY上創建SPFILE
h.啟動STANDBY:
startup nomount
alter database mount standby database
i.初始化日志應用服務
alter database recover managed standby database disconnect from session;
3、DATAGUARD維護
a.日志傳送服務
有些情況下,你可能需要在歸檔日志和應用日志之間有個時間間隔,此時可以通過在STANDBY上指定參數log_archive_dest_n中指定delay=minutes屬性。
STANDBY上的日志應該與主庫上的日志大小相同,另外STANDBY上的日志組應該比主庫多,因為這樣歸檔操作才有時間完成。也就是RFS(日志接收)進程在使用STANDBY的日志前,不用等待該日志被歸檔。最簡單判斷日志組是否夠的方法是查看警告日志和RFS的TRACE文件。
增加STANDBY日志文件的方法:
alter database 語句中使用add standby logfile子句。相關視圖v$standby_log,v$logfile
增加STANDBY日志組的方法:
alter database add standby logfile group 10 ('文件名1','文件名2') size 100M對於多個 STANDBY共享歸檔日志文件目的地,有些情況下需要指定log_archive_dest_n參數的dependency屬性,該屬性的作用是說明該目的地依賴於父目的地的成功歸檔。
參數log_archive_dest_n還可以指定reopen、max_failures、sync、async屬性。通過給該參數指定LGWR或者ARCH屬性以選擇是用LGWR還是ARCH進程傳送日志。
用於日志接收的幾個進程是:LGWR,ARCH,RFS,FAL。FAL進程用於解決日志縫。
設置數據保護模式的語句為:alter database set standby database to maximun(protection|availability|performance)
b.日志應用服務
對於物理STANDBY,日志應用服務涉及到下面幾個進程:RFS,ARC,MRP。MRP是管理恢復進程。
啟動STANDBY的恢復操作的幾個命令:alter database recover managed standby database(啟動前台會話);alter database recover managed standby database disconnect from session(啟動后台會話,也就是說會話可以繼續干別的事情);alter database recover managed standby database cancel(停止日志應用).
可以通過查詢視圖v$managed_standby查看日志應用情況。
c.數據文件管理
當主庫新創建數據文件,可定義參數standby_file_management為auto,讓standby也自動創建數據文件。如果主庫和standby的數據文件的目錄結構不一樣,可以設定db_file_name_convert將主庫上的文件名轉換成standby上的文件名。如果standby_file_management設為auto,則不能在standby上重命名或創建數據文件、日志文件。
每分鍾主庫會詢問standby是否有gap,該行為被稱為heartbeat.
可以查詢視圖v$archived_gap,如果發現有GAP,則可以從主庫上將日志文件拷貝到standby,然后將相關文件注冊到standby,具體方法是:alter database register logfile '文件名'。當然也可以通過設置參數fal_server,fal_client,讓日志應用服務自動處理gap問題。
對於STANDBY日志應用服務,下面幾個視圖有助於監控:v$managed_standby,v$archived_dest_status,v$archived_log,v$log_status,v$dataguard_status.
可以設置參數log_archive_trace對歸檔進行不同級別的跟蹤。
d.角色轉換
ORACLE支持兩種形式的角色轉換----switchover和failover
switchover包含兩個步驟,首先主庫被轉換成STANDBY,然后STANDBY被轉換成主庫
switchover的准備工作:完成角色轉換需要改變的參數(必須改變所有STANDBY上的 log_archive_dest_n和log_archive_dest_state_n);確保主庫和所有STANDBY都有連接;確認沒有用戶連接到數據庫;對於RAC環境確保只有一個實例是活動狀態;角色轉換之前,主庫實例應該是OPEN狀態,而STANDBY實例是MOUNT狀態,因為這樣的話,轉換過程中STANDBY數據庫也可以應用歸檔日志,如果STANDBY為READONLY,切換操作仍然可以進行,只是要花一點額外的時間;如果切換操作包含邏輯STANDBY,那么,主庫實例和STANDBY實例都必須為OPEN狀態;將要轉換成主庫的STANDBY變成歸檔模式;取消在該STANDBY庫上的日志延遲。
switchover的步驟:在當前主庫上,首先確認可以執行switchover操作(select switchover_status from v$database,如果值為TO STANDBY則可以切換,否則需要檢查當前DATAGUARD配置是否運行正常),然后將主庫切換為STANDBY(執行ALTER DATABASE COMMIT TO SWITCHOVER TO PHYSICAL STANDBY;這樣原控制文件被備份並生成新的STANDBY控制文件,然后只要重新啟動該庫為STANDBY模式就可以了);以上操作完成后,在原STANDBY數據庫上,需要查詢原主庫的切換信息是否被目標STANDBY接收到(SELECT SWITCHOVER_STATUS FROM V$DATABASE;如果結果為SWITCHOVER PENDING說明STANDBY切換為PRIMARY是可行的,否則需要檢查DATAGUARD的配置是否運行正常),然后執行ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY;將STANDBY轉換成PRIMARY,並重新啟動該庫。這里需要說明的是如果該庫在線重做日志不存在,該切換語句會自動創建它們,然而這樣一來,會花費很長的時間。因此ORACLE建議手工增加在線重做日志。手工增加在線重做日志的方法有兩種:第一種是將原主庫的日志拷貝到原STANDBY,並且定義參數log_file_name_convert,讓它將standby和新的日志聯系起來。第二種方法是DROP所有目標STANDBY上存在的日志,並且用命令ALTER DATABASE ADD STANDBY LOGFILE創建新的日志。switchover的最后一步是將新生成的STANDBY轉換成恢復模式,並將新PRIMARY進行一次歸檔操作。
failover的准備工作:完成角色轉換需要改變的參數(必須改變所有STANDBY上的log_archive_dest_n和log_archive_dest_state_n);確保主庫和所有STANDBY都有連接;對於RAC環境確保只有一個實例是活動狀態;如果要進行failover操作的STANDBY當前運行於最大保護模式,則應該將它轉換成最大性能模式(通過命令ALTER DATABASE SET STANDBY DATABASE TO MAXIMIZE PERFORMANCE;)
failover的步驟:首先發現並解決日志GAP的問題,然后從其它庫中將日志號高於本庫的日志拷貝過來並應用這些日志,如果你沒有手工注冊新的日志,那么可以執行下面的語句ALTER DATABASE RECOVER MANAGED STANDBY DATABASE FINISH;否則需要執行的語句為ALTER DATABASE RECOVER MANAGED STANDBY DATABASE FINISH SKIP STANDBY LOGFILE;接下來執行ALTER DATABASE COMMIT TO SWITCHOVER TO PRIMARY;完成切換並重新啟動新的主庫,可能的話對主庫進行一次備份。
e.啟動STANDBY
STARTUP NOMOUNT;
ALTER DATABASE MOUNT STANDBY DATABASE;
ALTER DATABASE RECOVER MANAGED STANDBY DATABASE DISCONNECT FROM SESSION;
f.關閉STANDBY
首先確認是否處於恢復狀態:SELECT PROCESS, STATUS FROM V$MANAGED_STANDBY;
取消恢復操作:ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL;
SHUTDOWN IMMEDIATE;
g.讓standby運行於只讀訪問模式
啟動STANDBY為只讀模式:
STARTUP NOMOUNT;
ALTER DATABASE MOUNT STANDBY DATABASE;
ALTER DATABASE OPEN READ ONLY;
將恢復模式的STANDBY轉換成read only模式:
ALTER DATABASE RECOVER MANAGED STANDBY DATABASE CANCEL;
ALTER DATABASE OPEN READ ONLY;
h.讓STANDBY從READ ONLY轉變成恢復模式
ALTER DATABASE RECOVER MANAGED STANDBY DATABASE DISCONNECT FROM SESSION;
i.讓為只讀模式的STANDBY執行排序操作應該注意的問題:
排序操作不能使用非臨時表空間,臨時表空間必須是本地管理的,並且只包含臨時文件
如果在創建STANDBY時主庫沒有臨時表空間,則需要在主庫上創建臨時表空間,並執行ALTER SYSTEM SWITCH LOGFILE;將redo傳給STANDBY。如果要給STANDBY的臨時表空間增加臨時文件,需要先將STANDBY轉換成READ ONLY模式,並執行命令ALTER TABLESPACE temp1 ADD TEMPFILE '/disk1/oracle/dbs/s_temp1.dbf' SIZE 10M REUSE;增加臨時文件。
j.可以通過對STANDBY的備份實現對數據庫的備份。
k.主庫上的操作和STANDBY的應對:
如果你執行ALTER DATABASE CLEAR UNARCHIVED LOGFILE或者打開數據庫時使用RESETLOGS,那么必須重新創建STANDBY。
如果你在主庫上執行ALTER DATABASE ENABLE|DISABLE,如果你改變表空間的狀態,如果你設置了參數STANDBY_FILE_MANAGEMENT為AUTO並創建表空間或者增加數據文件,則不需要對STANDBY進行操作。
如果你在主庫上刪除了表空間或者數據文件,你需要在STANDBY上等日志應用后在操作系統上刪除相關數據文件。
如果你在主庫上重命名了數據文件,你也要在STANDBY上重命名(因為是對控制文件的改變,所以沒有日志傳過去,因此兩邊都要進行相同的操作)
如果你在主庫上改變了控制文件,你就要重新創建STANDBY控制文件或者重建STANDBY數據庫。
如果你在主庫上增加或刪除日志文件,你也需要在STANDBY上進行同步變化。
具體方法為:先取消恢復,如果STANDBY_FILE_MANAGEMENT為AUTO,則改為MANUAL,然后使用命令ALTER DATABASE ADD STANDBY LOGFILE 'prmy3.log' SIZE 100K;增加日志文件或者用命令ALTER DATABASE DROP STANDBY LOGFILE 'prmy3.log'DROP掉日志文件,最后恢復參數STANDBY_FILE_MANAGEMENT的值。
如果你在主庫上進行了nologging|unrecoverable等操作,則應該將包含這些變化的表空間拷貝到STANDBY。
如果你改變了主庫的參數文件,那么你也應該改變STANDBY的參數文件。
l.監控進程
SELECT PROCESS, CLIENT_PROCESS, SEQUENCE#, STATUS FROM V$MANAGED_STANDBY;
m.監控恢復操作的進程
SELECT ARCHIVED_THREAD#, ARCHIVED_SEQ#, APPLIED_THREAD#, APPLIED_SEQ# FROM V$ARCHIVE_DEST_STATUS;
[以上
來源]