主機復制容災:利用主機的IO復制鏡像功能(IO Mirror模塊)和VRG虛擬復制網關,將生產站點上虛擬機的數據遠程復制到容災站點,實現容災。
存儲陣列復制容災:利用存儲設備的遠程復制技術(hyperereplication),將數據從生產中心復制到災備站點,實現容災。
主機復制容災規划設計要點:
1. 規划前提:根據客戶的需求收集要容災的應用類型,IOPS(每秒傳輸的最大字節數)是多少,數據塊的大小,要容災多少虛擬機,客戶對容災的RTO和RPO的需求是多少。
RTO:允許業務中斷的最大時間
RPO:允許數據的最大丟失量(每秒丟失的數據量)
2. 網絡帶寬的規划分為管理鏈路和IO鏈路,IO鏈路分為初始復制帶寬和增量復制帶寬,管理鏈路不小於10mbps的帶寬,IO鏈路不小於50mbps的帶寬
IO 復制帶寬:
根據復制周期內平均寫業務IOPS計算:
主機復制容災=保護的虛擬機數量*每個虛擬機周期內業務繁忙期間平均寫業務 IOPS*數據塊大小*8÷0.7(8 是換算單位;0.7 是帶寬利率系數)
根據復制周期內所有數據變化量計算:
存儲復制容災=保護的虛擬機數量*虛擬機復制周期內平均變化數據量(MB)*8/(復制周期(分鍾)*60)
3. 生產/容災系統配置的規划:
①規划MAC地址,分為兩部分,生產站點一部分,容災站點一部分,並且不能重復。
②確定容災虛擬機的類型和數量。
③數據存儲的規划,災備站點一般是預留20%。
④對VRG數量的決定,一對 VRG 可保護虛擬機數量不超過 150 個,可保護虛擬機磁盤不超過200 個,根據需要保護的虛擬機數量進行規划,有計算公式可以得出。 VRG是虛擬復制網關,裝在兩個CNA節點上用於數據的傳輸。
⑤設置快照執行周期。
VRG數量:
SAN 存儲場景:
VRG數量=MAX(所有需容災虛擬機寫lOPS總和/500,所有需容災虛擬機的磁盤總數/200,所有需容災虛擬機數量/150),如遇小數,向上取整
FusionStorage場景:
VRG數量=MAX(所有需容災虛擬機寫lOPS總和/1500,所有需容災虛擬機磁盤總數/200,所有需容災虛擬機數量/150),如遇小數,向上取整。
生產與容災站點VRG需一一對應,且與主機綁定,每個主機上最多只能部署一個VRG。
如果兩端數據存儲形態不一致,以VRG數量最多的一端為准。
4. 生產站點的規划:
①首先在容災平台上去配置一些映射關系,包括雲平台、VRG、存儲、集群、主機、端口組的關系等。
②然后就是在VRG部署時,知道他的規格,至少要有2個CPU、6G內存,15G系統盤,100G的數據盤。 VRG的規格官方要求是不可進行調整的。
③然后是數據存儲的規划,首先都是要選擇一個虛擬化的一個數據存儲,並且VRG虛擬機建議使用獨立的數據存儲,不和其他的容災虛擬機使用相同的數據存儲。
5. 容災站點的規划和生產站點的規划基本相同,就是在數據存儲這一塊需要預留,數據存儲的容量這塊要多預留20%
存儲復制容災的遠程復制技術分同步遠程復制和異步遠程復制,同步是先寫入RM模塊,然后RM模塊對兩端進行雙寫,寫完返回成功IO算寫完成。異步是先寫入主cache,就返回寫成功的IO,然后寫入主存儲,打快照,再寫入到遠端的存儲中。
FusionSphere主備容災存儲復制容災的組網
實現兩BCManager 通信。可以單獨網絡,通過打通兩管理平面實現。
存儲設備需要接入管理網絡,被BCManager 接管
兩站點存儲設備通過兩站點的存儲層網絡設備鏈路實現數據容災
存儲復制容災實現的本地高可用、雙活、兩地三中心,與通用容災組網類似
1、定義:左邊為生產數據中心,右邊為災備數據中心,我們要將生產數據中心中的lun的數據災備到災備數據中心,通過BCM接入生產端存儲、災備端存儲,通過創建保護集、保護策略、保護計划,待同步周期到來,將數據從后端存儲鏈路傳遞至災備端。
2. RPO、RTO趨近於0
3、實現原理
4、限制條件:1、必須是華為存儲設備
2、必須有后端存儲鏈路
3、設備必須支持高級特性(中高端存儲)
FusionSphere主備容災主機復制容災的組網
存儲平面無需打通
BCManager無需管理存儲設備
建議給CNA節點單獨配置容災業務管理接口,讓其與VRG通信,不配置則走CNA管理接口
VRG與VRG之間通信需要配置主機IO 復制平面
VRG需要被BCManager接管
1. 實現兩BCManager 通信。可以通過打通兩管理平面實現,也可以單獨網絡。
2. VRG虛擬復制網關需要三個平面,有三個網卡:VRG與VRG、與CNA互通、與BCM互通:BCM下發策略給VRG執行。
3. BCManager上配置好了保護對象和保護策略,對主機業務進行保護。
I/O過程
①VM發起IO流,生產站點CNA收到后會進行IO雙寫,一份寫入生產存儲,一份通過I/O Mirror捕獲發給本端VRG
②本端VRG將I/O數據壓縮、加密通過主機復制平面發送給容災端VRG
③容災端VRG對I/O數據進行解壓縮、解密路由至相應CNA主機
④容災站點CNA主機把數據寫入備份存儲
當災難發生的時候,上層的BCManager發現生產端站點故障,它會將災備端備份存儲中的數據掛載給災備端的災備VM(災備VM是一個空VM,只有災難發生時才會拉活),完成業務拉起。
1、定義:左邊為生產數據中心,右邊為災備數據中心,將生產數據中心中的數據通過VRG傳輸至災備數據中心。通過BCM接入生產端VRG備端VRG,建立保護集、保護策略、保護計划,待通過周期到達后,將生產端數據通過主機IO復制網絡平面傳輸至災備端
2、RPO:趨近於0 RTO:異步 分鍾級
3、限制條件:1、適用於FusionSphere環境
2、只能使用異步方式
4、實現原理
保護集
保護策略:計算(主機、集群)、存儲(數據存儲上)、網絡(DVS上)
保護計划
*VRG的作用?
1. 聚合虛擬機的IO 數據並經過壓縮、加密后發送到遠端站點。
2. 接收遠端站點數據,並將數據路由發送到指定的主機上。
3. 提供復制策略下發、狀態查詢等管理接口。
*一對 VRG 能否對多台 CNA 上的虛擬機進行容災?
部署的 VRG 數量依賴於網絡、存儲等多種因素,建議每對 VRG 配置的虛擬機個數不超過 150 個,所有虛擬機磁盤總個數不超過 200 個。
<引伸: 生產站點和災備站點都需要部署 VRG 虛擬機,且部署方式為一對一部署 >
*主機復制與存儲復制適合於哪些場景?
主機復制適合的場景:
主機復制容災定位服務於中小型企業非關鍵性業務,建議支持的業務有 ERP (Enterprise Resource Planning)、郵件服務器和桌面雲等。
存儲復制適合場景:
1. 使用華為SAN設備,站點間通過IP 網絡連接。
2. 不希望生產中心與災備中心的距離受到限制。
3. 希望對虛擬機進行計划性的跨站點遷移。
4. 站點中業務需要連續性保護。
5. 存在虛擬機啟動優先級、依賴關系等復雜的恢復場景。
6. 容災演練具有較高優先級。
<關鍵點:
主機復制的RPO為分鍾級,RTO為秒級,如果有更高的容災要求,那么需要存儲復制實現,如雙活數據中心。
出於穩定性考慮,關鍵性業務不適合主機復制場景
主機復制只適合於FusionSphere場景
>
*一對 VRG 保護的虛擬機超過 150 個虛擬機怎么辦?
再部署一對 VRG 然后在 BCManager 上關聯 VRG
*基於主機復制
CNA 主機上必須要有 IOMirror 模塊,且 CNA 上虛擬機的 IO 能被其捕獲到,通過 CNA 的IOMirror 模塊完成數據的鏡像 IO。
*VRG 之間用了 FusionCompute 上的啥功能:
IO mirror
*為什么主機復制不可以使用FusionStorage為數據存儲?
虛擬化數據存儲特指由 CNA 自身實現的虛擬化特性,例如快照、精簡磁盤等,即對應存儲虛擬化為主機存儲虛擬化+文件系統。FusionStorage 支持虛擬化特性,是通過 FusionStorage存儲系統自身機制實現的,但 CNA 並未參與,因此 FusionStorage 不是虛擬化數據存儲。
*那只有 FusionStorage 作為存儲的時候,就無法實現主機復制?
當虛擬機的基本塊設置設為支持時,源端支持 FusionStorage 虛擬化存儲。
*主機復制、存儲復制容災二者區別?
1、在數據容災的實現方式上是不同的。主機復制容災通過部署 VRG 的 VM 將數據從生產站點傳送到生產站點。存儲復制容災是采用兩站點之間陣列復制實現的。
2、RPO、RTO 值不同。主機復制秒級分鍾組;存儲復制中兩個值比較靈活。
3、應用場景。主機復制應用於中小企業非關鍵性業務;存儲復制應用於所有,重點在關鍵業務中應用。
4、虛擬化平台限制原因不同。主機復制只應用於華為 FusionCompute。
5、兩站點距離不同。主機復制更小些。
6、存儲復制對上層應用無限制,主機復制限制為 FusionSphere。
7、主機復制應用 VRG,消耗計算節點的計算資源。
8、存儲復制可以同步/異步傳輸數據,主機復制只可以異步。
FusionSphere 主機復制場景的規划?
1. 兩端 BCManager 通信實現:可以打通兩數據中心的管理平面,或者單獨網絡。
2. BCManager 部署模式:分布式部署與災備站點部署一個。
3. BCManager 通信鏈路帶寬一般為 10Mps。
4. 主機 IO 復制鏈路需要根據復制周期內平均業務 IOPS 計算。
5. 計算公式:保護虛擬機數量*每個虛擬機周期內業務繁忙期間平均寫業務IOPS*數據塊大小*8/0.7(帶寬利用率系數)
6. VRG 部署數量:一對 VRG 可保護虛擬機數量不超過 150 個,可保護虛擬機磁盤不超過200 個。根據需要保護虛擬機數量進行規划。
7. BCManager 上保護組、保護策略、恢復計划等規划。
8. Domain0 規格調整。Domain 0 內存大小需要在原有基礎上增加 4GB。
FusionSphere 容災的兩種方式
可以實現多活和主備:
1. 存儲層 hypermetro 特性,實現多活
2. VRG,只能實現主備
存儲復制容災和主機復制容災
通過存儲復制容災,容災全景圖中的所有的容災方案都適合,並無特殊之處。
主機復制容災,只適合於主備容災場景,因其通過 VRG完成數據容災,RPO、RTO 值都大於0。
基於主機復制容災,生產端會打快照嗎?
不會,因為 IO 的流動是通過 IOmirror 來完成的,IOmirror 不需要快照技術去提供支持。
虛擬機熱遷移中的完整遷移,存儲也是沒有打快照的。
VRG 的組網、功能和限制
VRG 的規格:2CPU、6G內存、15G系統盤、100G數據盤(logcache 盤:用於存儲異步傳輸的 IO)
主機層復制的 IOMirror 是如何把數據傳給 VRG 的?
IOMirror 首先從名字上來說,它會把數據相當於鏡像,然后將鏡像過的數據通過 IP 轉發給VRG,在主機復制的場景當中,需要給 CNA 主機添加“虛擬機容災數據流量業務管理接口”。
VRG 進行主機復制容災,它是同步還是異步,還是二者都有?
只有異步。RPO>0 秒 RTO>0 分鍾
10 個 LUN 映射給 10 個主機,選擇什么容災?
在華為針對虛擬化平台的容災方案中,我會選擇主機復制容災,原因是這 10 個 LUN 中有可能存在不需要保護的 VM,主機復制容災的精度可以做得更高一些。
如果在FusionCompute場景下,肯定會使用華為的主機復制容災解決方案,如果是其它虛擬化場景,如 KVM、VMware 場景下,我會尋找跟 FusionCompute 主機復制容災解決方案類似的解決方案,假設如果找不到一個主機層面上的解決方案的話,我會嘗試將這 10 個 VM 遷移至同一個LUN 當中,然后采用存儲陣列復制容災,如果不可以的話卻一定要實現容災的話,那就只能進行存儲陣列復制容災解決方案。
容災網絡帶寬應該從哪些方面考慮:
虛擬機數量、數據量,同步復制還應考慮數據變化量(閑時和忙時)
主機復制、存儲復制實現原理?
主機復制:
步驟如下:
1、 創建需保護虛擬機並安裝部署好軟件與數據。
2、 配置站點信息。 配置站點間資源映射關系。(集群,主機,端口組,數據存儲)
3、 配置 VRG 上要復制的虛擬機
4、 自動創建占位虛擬機,用以備份容災虛擬機的數據,以便在容災虛擬機故障后進行數據恢復。
5、 創建虛擬機保護組,選擇要保護的虛擬機,並設置保護策略。
6、 容災保護相關配置數據同步。
7、 針對保護策略創建恢復計划,配置虛擬機啟動順序。
8、 根據保護策略定期對占位虛擬機創建虛擬機快照(防止同步過程中數據損壞,而導致數據不可用)
存儲復制:
步驟如下:
1、 生產站點中創建主 LUN;
2、 將主 LUN 映射到 FusionCompute 環境中,且將容災 VM 部署到數據存儲中
3、 容災站點創建從 LUN,大小與主 LUN 相同;
4、 生產站點配置遠端設備,配置 LUN 遠程復制關系與一致性組;
5、 在 BCManager 中配置站點間資源映射關系;(集群,主機,端口組的映射)
6、 在 BCManager 中注冊存儲設備,發現遠程復制 LUN 與一致性組;
7、 在 BCManager 中創建保護組。
8、 創建保護策略
9、 容災保護相關配置數據同步;
10、針對保護策略創建恢復計划,配置 VM 啟動順序
為什么主機復制需要虛擬化數據存儲?
因為實現主機復制過程中,需要根據保護策略定期對占位虛擬機創建虛擬機快照。
主機復制、存儲復制配置過程?
FusionSphereOpenstack 容災組網設計
容災模塊設計
桌面雲容災組網和實現原理
。FusionSphere 主機復制場景的規划?
1. 兩端 BCManager 通信實現:可以打通兩數據中心的管理平面,或者單獨網絡。
2. BCManager 部署模式:分布式部署與災備站點部署一個。
3. BCManager 通信鏈路帶寬一般為 10Mps。
4. 主機 IO 復制鏈路需要根據復制周期內平均業務 IOPS 計算。
5. 計算公式:保護虛擬機數量*每個虛擬機周期內業務繁忙期間平均寫業務 IOPS*數據塊大小 *8/0.7(帶寬利用率系數)
6. VRG 部署數量:一對 VRG 可保護虛擬機數量不超過 150 個,可保護虛擬機磁盤不超過 200 個。1100 個 IOPS 根據需要保護虛擬機數量進行規划。
7. BCManager 上保護組、保護策略、恢復計划等規划。
。VRG 有幾個網卡?分別有什么作用?
三張網卡
1. 用於和BCManager通信,需要配置為和BCManager虛擬機相通的分布式交換機和端口組。
2. 用於和CNA主機通信,用於和主機的業務管理接口通信,需要配置為和主機業務管理接口相通的分布式交換機和端口組。
3. 用於和對端站點的 VRG 通信,需要配置為和對端站點相通的分布式交換機和端口組。
。主從切換和容災演練區別?主從切換如何實現的?
主從切換:從 LUN 升為主 LUN
容災演練區別:沒切換LUN
主從切換:一鍵式計划遷移,一鍵式故障恢復里面都有主從切換
。基於存儲復制一鍵式容災測試與清理
。基於存儲復制的一鍵式故障恢復
。基於存儲復制的一鍵式計划性遷移
。基於主機復制的一鍵式容災測試與清理
。基於主機復制一鍵式故障恢復
。基於主機復制的一鍵式計划性遷移
。容災測試、故障恢復、計划性遷移的區別
1) 對生產站點的影響:
容災測試前、后,生產站點都保持正常的運行狀態,容災測試對生產站點無影響。
故障恢復前,生產站點已故障,僅在容災站點作相應操作,拉起容災業務
計划性遷移前,生產站點正常,計划性遷移后,業務切換到容災站點,生產站點業務停止
2) 價值:
容災測試用來驗證復制到災備站點的數據的可用性或快照的可用性
故障恢復可以在生產站點發生災難時,一鍵式拉起容災業務
計划性遷移在非災難性停止前,可以提前切換業務,減少停機對業務的影響
3) 實現的方式
詳見前面的每個步驟。
考試追問:
VRG之間的帶寬單位是什么?
mb/s
VRG的帶寬為什么需要乘8?
單位的換算。字節轉比特 1B=8b
數據塊大小單位?
MB
為什么需要乘虛擬機業務繁忙時的IOPS?
因為不以繁忙時帶寬計算帶寬,可能會數據傳輸效率低。
業務繁忙時的iops數據如何計算?
具體說下VRG怎么部署,操作?
生產站點與災備站點一一對應,且與主機進行綁定。