1 簡介
實時主備由一個主庫以及一個或者多個配置了實時(Realtime)歸檔的備庫組成,其主要目的是保障數據庫可用性,提高數據安全性。實時主備系統中,主庫提供完整的數據庫功能,備庫提供只讀服務。主庫修改數據產生的Redo日志,通過實時歸檔機制,在寫入聯機Redo日志文件之前發送到備庫,實時備庫通過重演Redo日志與主庫保持數據同步。當主庫出現故障時,備庫在將所有Redo日志重演結束后,就可以切換為主庫對外提供數據庫服務。
DM 數據守護(Data Watch)是一種集成化的高可用、高性能數據庫解決方案,是數據庫異地容災的首選方案。通過部署 DM 數據守護,可以在硬件故障(如磁盤損壞)、自然災害(地震、火災)等極端情況下,避免數據損壞、丟失,保障數據安全,並且可以快速恢復數據庫服務,滿足用戶不間斷提供數據庫服務的要求。與常規的數據庫備份(Backup)、還原(Restore)技術相比,數據守護可以更快地恢復數據庫服務。隨着數據規模不斷增長,通過還原手段恢復數據,往往需要數個小時、甚至更長時間,而數據守護基本不受數據規模的影響,只需數秒時間就可以將備庫切換為主庫對外提供數據庫服務。
2 環境
外網114.116.236.85 |
node1 |
主節點 |
內網 192.168.1.12 |
||
外網121.36.6.217 |
node2 |
備節點 |
內網192.168.1.154 |
3 數據准備
本次部署不涉及達夢數據庫安裝,
3.1 脫機備份、脫機還原方式
##也可以進行聯機備份、脫機還原方式
1)正常關閉數據庫
2)進行脫機備份
cd /dameng/database/bin
./dmrman CTLSTMT="BACKUP DATABASE '/dameng/database/data/DAMENG/dm.ini' FULL TO BACKUP_FILE1 BACKUPSET '/dameng/database/data/BACKUP_FILE_01'"
3)拷貝備份文件到備庫所在機器
4)執行脫機數據庫還原與恢復
./dmrman CTLSTMT="RESTORE DATABASE '/dameng/database/data/DAMENG/dm.ini' FROM
BACKUPSET '/dameng/database/data/BACKUP_FILE_01'"
./dmrman CTLSTMT="RECOVER DATABASE '/dameng/database/data/DAMENG/dm.ini' FROM
BACKUPSET '/dameng/database/data/BACKUP_FILE_01'"
./dmrman CTLSTMT="RECOVER DATABASE '/dameng/database/data/DAMENG/dm.ini' UPDATE DB_MAGIC"
注意:
如果單節點系統已經上線,數據庫服務不允許中斷情況下,可以按照備庫重建 的步驟完成備庫數據准備。
另外備份文件中會記錄原備份庫的模式和 OGUID 信息,使用備份文件還原成功后,需要再根據實際配置情況修改數據庫的模式和 OGUID 值。如果備份集中記錄的原備份庫模式是 Primary,則還原后的庫會一律改為Standby 模式,如果還原后的庫是用作備庫,則不需要再手動修改 Standby模式。
如果執行備份時,待備份的庫是 Normal 模式,並且不能確定這個庫一定作為主庫使用,則對 Normal 模式的庫必須使用脫機備份,不能使用聯機備份方式,避免備份完成后,Normal 模式的庫 LSN 有增長,又將其修改為 Standby 模式,而使用備份集還原后的庫修改Primary 模式,備庫數據比主庫數據多,導致主備數據不一致的情況出現。
3.2 檢查數據一致性
依次到每個實例上,以 mount 方式啟動數據庫。
./dmserver /dameng/database/data/DAMENG/dm.ini mount &
啟動命令行工具 DIsql,分別登錄各個實例查詢 LSN 值,如果主庫和備庫的 FILE_LSN 和 CUR_LSN 值相同,可以確保數據完全一致。
select file_LSN, cur_LSN from v$rlog;
檢查實例的永久魔數是否一致:
確保 LSN 和永久魔數都一致的情況下,正常關閉各個實例,繼續配置數據守護。
3.3 守護進程控制文件
對於故障場景中,某個全局守護類型的實例所在機器故障,數據無法繼續使用的情況下,從當前的有效主庫直接拷貝數據文件或者備份還原方式重新准備數據后,需要同時拷貝主庫的守護進程控制文件 dmwatcher.ctl 到實例的數據文件目錄下。
4配置主備
4.1 配置主庫
4.1.1 配置dm.ini
INSTANCE_NAME = DMSERVER_01
PORT_NUM = 32141 #數據庫實例監聽端口
DW_INACTIVE_INTERVAL = 60 #接收守護進程消息超時時間
ALTER_MODE_STATUS = 0 #不允許手工方式修改實例模式/狀態
ENABLE_OFFLINE_TS = 2 #不允許備庫 OFFLINE 表空間
MAL_INI = 1 #打開 MAL 系統
ARCH_INI = 1 #打開歸檔配置
RLOG_SEND_APPLY_MON = 64 #統計最近 64 次的日志發送信息
4.1.2 配置 dmmal.ini
配置 MAL 系統,各主備庫的 dmmal.ini 配置必須完全一致,MAL_HOST 使用內部網絡IP,MAL_PORT 與 dm.ini 中 PORT_NUM 使用不同的端口值,MAL_DW_PORT 是各實例對應的守護進程之間,以及守護進程和監視器之間的通信端口,配置如下:
MAL_CHECK_INTERVAL = 5 #MAL 鏈路檢測時間間隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 鏈路斷開的時間
[MAL_INST1]
MAL_INST_NAME = DMSERVER_01 #實例名,和 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 192.168.1.12 #MAL 系統監聽 TCP 連接的 IP 地址
MAL_PORT = 61141 #MAL 系統監聽 TCP 連接的端口
MAL_INST_HOST = 114.116.236.85 #實例的對外服務 IP 地址
MAL_INST_PORT = 32141 #實例的對外服務端口,和 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 52141 #實例本地的守護進程監聽 TCP 連接的端口
MAL_INST_DW_PORT = 33141 #實例監聽守護進程 TCP 連接的端口
[MAL_INST2]
MAL_INST_NAME = DMSERVER_02
MAL_HOST = 192.168.1.154
MAL_PORT = 61142
MAL_INST_HOST = 121.36.6.217
MAL_INST_PORT = 32142
MAL_DW_PORT = 52142
MAL_INST_DW_PORT = 33142
4.1.3 配置 dmarch.ini
修改 dmarch.ini,配置本地歸檔和實時歸檔。
除了本地歸檔外,其他歸檔配置項中的 ARCH_DEST 表示實例是 Primary 模式時,需
要同步歸檔數據的目標實例名。
當前實例 DMSERVER_01 是主庫,需要向 DMSERVER_02(實時備庫)同步數據,因此實
時歸檔的 ARCH_DEST 配置為 DMSERVER_02。
[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #實時歸檔類型
ARCH_DEST = DMSERVER_02 #實時歸檔目標實例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地歸檔類型
ARCH_DEST = /dameng/database/data/DAMENG/arch #本地歸檔文件存放路徑
ARCH_FILE_SIZE = 128 #單位 Mb,本地單個歸檔文件最大值
ARCH_SPACE_LIMIT = 0 #單位 Mb,0 表示無限制,范圍 1024~4294967294M
4.1.4 配置 dmwatcher.ini
修改 dmwatcher.ini 配置守護進程,配置為全局守護類型,使用自動切換模式。
[GRP1]
DW_TYPE = GLOBAL #全局守護類型
DW_MODE = AUTO #自動切換模式
DW_ERROR_TIME = 10 #遠程守護進程故障認定時間
INST_RECOVER_TIME = 60 #主庫守護進程啟動恢復的間隔時間
INST_ERROR_TIME = 10 #本地實例故障認定時間
INST_OGUID = 453331 #守護系統唯一 OGUID 值
INST_INI = /dameng/database/data/DAMENG/dm.ini #dm.ini 配置文件路徑
INST_AUTO_RESTART = 1 #打開實例的自動啟動功能
INST_STARTUP_CMD = /dameng/database/bin/dmserver #命令行方式啟動
RLOG_SEND_THRESHOLD = 0 #指定主庫發送日志到備庫的時間閥值,默認關閉
RLOG_APPLY_THRESHOLD = 0 #指定備庫重演日志的時間閥值,默認關閉
4.1.5 啟動主庫
以mount方式啟動主庫
./dmserver /dameng/database/data/DAMENG/dm.ini mount &
注意:
一定要以 Mount 方式啟動數據庫實例,否則系統啟動時會重構回滾表空間,生成 Redo 日志;並且,啟動后應用可能連接到數據庫實例進行操作,破壞主備庫的數據一致性。數據守護配置結束后,守護進程會自動 Open 數據庫
4.1.6 設置 OGUID
啟動命令行工具 DIsql,登錄主庫設置 OGUID 值。
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(453331);
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
注意:系統通過 OGUID 值確定一個守護進程組,由用戶保證 OGUID 值的唯一性,並確保數據守護系統中,數據庫、守護進程和監視器配置相同的 OGUID 值。
4.1.7 修改數據庫模式
啟動命令行工具 DIsql,登錄主庫修改數據庫為 Primary 模式
SQL>alter database primary;
4.2 配置備庫
4.2.1 配置dm.ini
INSTANCE_NAME = DMSERVER_02
PORT_NUM = 32142 #數據庫實例監聽端口
DW_INACTIVE_INTERVAL = 60 #接收守護進程消息超時時間
ALTER_MODE_STATUS = 0 #不允許手工方式修改實例模式/狀態
ENABLE_OFFLINE_TS = 2 #不允許備庫 OFFLINE 表空間
MAL_INI = 1 #打開 MAL 系統
ARCH_INI = 1 #打開歸檔配置
RLOG_SEND_APPLY_MON = 64 #統計最近 64 次的日志發送信息
4.2.2 配置 dmmal.ini
配置 MAL 系統,各主備庫的 dmmal.ini 配置必須完全一致,MAL_HOST 使用內部網絡IP,MAL_PORT 與 dm.ini 中 PORT_NUM 使用不同的端口值,MAL_DW_PORT 是各實例對應的守護進程之間,以及守護進程和監視器之間的通信端口,配置如下:
MAL_CHECK_INTERVAL = 5 #MAL 鏈路檢測時間間隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 鏈路斷開的時間
[MAL_INST1]
MAL_INST_NAME = DMSERVER_01 #實例名,和 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 192.168.1.12 #MAL 系統監聽 TCP 連接的 IP 地址
MAL_PORT = 61141 #MAL 系統監聽 TCP 連接的端口
MAL_INST_HOST = 114.116.236.85 #實例的對外服務 IP 地址
MAL_INST_PORT = 32141 #實例的對外服務端口,和 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 52141 #實例本地的守護進程監聽 TCP 連接的端口
MAL_INST_DW_PORT = 33141 #實例監聽守護進程 TCP 連接的端口
[MAL_INST2]
MAL_INST_NAME = DMSERVER_02
MAL_HOST = 192.168.1.154
MAL_PORT = 61142
MAL_INST_HOST = 121.36.6.217
MAL_INST_PORT = 32142
MAL_DW_PORT = 52142
MAL_INST_DW_PORT = 33142
4.2.3 配置 dmarch.ini
修改 dmarch.ini,配置本地歸檔和實時歸檔。
除了本地歸檔外,其他歸檔配置項中的 ARCH_DEST 表示實例是 Primary 模式時,需要同步歸檔數據的目標實例名。當前實例 DMSERVER_02 是備庫,守護系統配置完成后,可能在各種故障處理中,DMSERVER_02 切換為新的主庫,正常情況下,DMSERVER_01 會切換為新的備庫,需要向DMSERVER_01 同步數據,因此實時歸檔的 ARCH_DEST 配置為 DMSERVER_01。
[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #實時歸檔類型
ARCH_DEST = DMSERVER_01 #實時歸檔目標實例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地歸檔類型
ARCH_DEST = /dameng/database/data/DAMENG/arch #本地歸檔文件存放路徑
ARCH_FILE_SIZE = 128 #單位 Mb,本地單個歸檔文件最大值
ARCH_SPACE_LIMIT = 0 #單位 Mb,0 表示無限制,范圍 1024~4294967294M
4.2.4 配置 dmwatcher.ini
修改 dmwatcher.ini 配置守護進程,配置為全局守護類型,使用自動切換模式。
[GRP1]
DW_TYPE = GLOBAL #全局守護類型
DW_MODE = AUTO #自動切換模式
DW_ERROR_TIME = 10 #遠程守護進程故障認定時間
INST_RECOVER_TIME = 60 #主庫守護進程啟動恢復的間隔時間
INST_ERROR_TIME = 10 #本地實例故障認定時間
INST_OGUID = 453331 #守護系統唯一 OGUID 值
INST_INI = /dameng/database/data/DAMENG/dm.ini #dm.ini 配置文件路徑
INST_AUTO_RESTART = 1 #打開實例的自動啟動功能
INST_STARTUP_CMD = /dameng/database/bin/dmserver #命令行方式啟動
RLOG_APPLY_THRESHOLD = 0 #指定備庫重演日志的時間閥值,默認關閉
4.2.5 啟動備庫
以 Mount 方式啟動備庫
./dmserver /dameng/database/data/DAMENG/dm.ini mount &
注意:
一定要以 Mount 方式啟動數據庫實例,否則系統啟動時會重構回滾表空間,生成 Redo 日志;並且,啟動后應用可能連接到數據庫實例進行操作,破壞主備庫的數據一致性。數據守護配置結束后,守護進程會自動 Open 數據庫
4.2.6 設置 OGUID
啟動命令行工具 DIsql,登錄備庫設置 OGUID 值為 453331
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL>sp_set_oguid(453331);
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
注意:系統通過 OGUID 值確定一個守護進程組,由用戶保證 OGUID 值的唯一性,並確保數據守護系統中,數據庫、守護進程和監視器配置相同的 OGUID 值。
4.2.7 修改數據庫模式
啟動命令行工具 DIsql,登錄備庫修改數據庫為 Standby 模式。
如果當前數據庫不是 Normal 模式,需要先修改 dm.ini 中 ALTER_MODE_STATUS 值為 1,允許修改數據庫模式,修改 Standby 模式成功后再改回為 0。
如果是 Normal 模式,請忽略下面的第 1 步和第 3 步。
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); ----第 1 步
SQL>alter database standby; ----第 2 步
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0); ----第 3 步
4.3 配置監視器
由於主庫和實時備庫的守護進程配置為自動切換模式,因此這里選擇配置確認監視器。和普通監視器相比,確認監視器除了相同的命令支持外,在主庫發生故障時,能夠自動通知實時備庫接管為新的主庫,具有自動故障處理的功能。
注意:故障自動切換模式下,必須配置確認監視器,且確認監視器最多只能配置一個。
MON_DW_CONFIRM = 1 #確認監視器模式
MON_LOG_PATH = /dameng/database/data/DAMENG/mon_log #監視器日志文件存放路徑
MON_LOG_INTERVAL = 60 #每隔 60s 定時記錄系統信息到日志文件
MON_LOG_FILE_SIZE = 32 #每個日志文件最大 32M
MON_LOG_SPACE_LIMIT = 0 #不限定日志文件總占用空間
[GRP1]
MON_INST_OGUID = 453331 #組 GRP1 的唯一 OGUID 值
#以下配置為監視器到組 GRP1 的守護進程的連接信息,以“IP:PORT”的形式配置
#IP 對應 dmmal.ini 中的 MAL_HOST,PORT 對應 dmmal.ini 中的 MAL_DW_PORT
MON_DW_IP = 192.168.1.12:52141
MON_DW_IP = 192.168.1.154:52142
4.4 啟動守護進程
啟動各個主備庫上的守護進程:
dmwatcher /dameng/database/data/DAMENG/dmwatcher.ini &
守護進程啟動后,進入 Startup 狀態,此時實例都處於 Mount 狀態。守護進程開始廣播自身和其監控實例的狀態信息,結合自身信息和遠程守護進程的廣播信息,守護進程將本地實例 Open,並切換為 Open 狀態。
select status$ from v$instance;
4.5 啟動監視器
啟動監視器:
./dmmonitor /dameng/database/data/DAMENG/dmmonitor.ini
監視器提供一系列命令,支持當前守護系統狀態查看以及故障處理,可輸入 help 命令,查看各種命令說明使用,結合實際情況選擇使用。至此一主一備的實時數據守護系統搭建完畢,在搭建步驟和各項配置都正確的情況下,在監視器上執行 show 命令,可以監控到所有實例都處於 Open 狀態,所有守護進程也都處於 Open 狀態,即為正常運行狀態。
4.6 登錄監視器
啟動監視器后,輸入 login
用戶名/密碼 : SYSDBA/SYSDBA
可輸入show,查看當前集群的主備狀態;
至此,達夢數據守護|+主備搭建完成。