華為雲計算IE面試筆記-請描述華為容災解決方案全景圖，並解釋雙活數據中心需要從哪些角度着手考慮雙活設計

本文轉載自查看原文 2021-09-28 09:21 391 華為雲

容災全景圖：按照距離划分：分為本地容災同城容災異地容災

本地容災包括本地高可用和本地主備。（本數據中心的兩機房、機櫃）

本地高可用這個方案為了保持業務的連續性，從兩個層面來考慮：

①一個是從主機、服務器這個層面考慮，假如這個服務器上的虛擬機或者業務掛了，可以自動的從其他服務器上把它拉活，以此來保證業務的連續性，主要是通過集群HA、DRS、DPM的這些特性。

②另一個就是從存儲層面來考慮，使用的Hypermetro特性/ HyperMirror+SmartVirtualization（異構存儲，RTO、RPO>0）。推薦Hypermetro

Hypermetro特性基於兩套存儲陣列實現雙活，兩端陣列的雙活LUN數據實時同步，且雙端能夠同時處理應用服務器的 I/O 讀寫請求，面向應用服務器提供無差異的兩個站點並行訪問能力。當任何一台磁盤陣列故障時，業務自動無縫切換到對端存儲訪問，業務訪問不中斷。

本地高可用的RTO=0、RPO=0。

本地主備容災使用的是同步遠程復制技術實現的。RPO=0、RTO>0

主備主要是存儲層的遠程復制。

同城容災包括同城主備容災和同城雙活容災。（同城的兩數據中心（300km內））

同城主備容災通過同步遠程復制技術和異步遠程復制技術實現，這兩種技術在寫復制的時候不一樣。同步遠程復制是對端（災備端）寫IO完成返回寫成功，異步遠程復制就是本端寫IO完成返回寫成功。主備容災這個技術很成熟，但是會停止業務，RTO>0，如果是同步遠程復制技術，RPO=0,如果是異步遠程復制技術，RPO>0。

同城雙活容災這個技術通過華為的Hypermetro實現，一端業務故障時，另一端系統能夠自動拉起，但使用雙活的成本高，理論上RTO=0、RPO=0。

異地容災包括兩地三中心和主備容災。（兩數據中心距離大於300km）

兩地三中心是同城雙活或同城主備再與異地主備實現兩地三中心技術，使用的是並聯或級聯技術，適用於業務不允許中斷，對數據要求嚴格的場景，如金融機構等。RTO、RPO較靈活。

另外一種是異地主備容災的方式，跟同城容災的主備相比方式不一樣，主要是用異步遠程復制實現的。RTO>0、RPO>0

雙活數據中心：

雙活要從全面的角度考慮的話，從安全層、傳輸層、業務（應用）層、網絡層、計算集群、存儲層來考慮

安全層通過防火牆、安全策略規划和設計保證來訪問安全。

傳輸層通過設備、鏈路和板卡冗余，構建可靠的雙活傳輸網絡。波分設備提升光信號傳輸距離。實現鏈路復用，將數據中心兩對鏈路，減少到一對鏈路。

業務（應用）層雙活通過負載均衡來實現，也就是GSLB和SLB實現的，通過應用集群技術和數據庫集群技術實現。C/S通過應用集群自身特性（Oracle RAC 、IBM DB2），B/S通過LB實現業務負載。

網絡層雙活數據中心間IP和FC網絡互通。通過全局負載均衡器（GSLB）、服務器負載均衡器（SLB）實現雙活。如果外部有一個業務請求信息過來，先到SLB，SLB會查看自己所在的數據中心的主機是否可用，能否提供業務，如果發現主機故障，這時候會觸發GSLB，然后改GSLB會通知對端的GLSB開始工作，GSLB會通知下面的SLB工作，SLB會通知底下的主機對業務請求做出響應，然后返回響應給對端，完成雙活。

SLB\GSLB：

對象不一樣：

SLB：本數據中心內的流量負載，數據中心內的故障切換

GSLB：做到兩個數據中心間的流量的負載，保證用戶可以使用距離最近的服務器，從而確保訪問質量。

原理不一樣：

SLB是通過代理的方式去選擇用戶選擇哪一台Web服務器。

GSLB采用DNS解析控制用戶訪問哪個數據中心

計算集群雙活將兩個數據中心的服務器添加至同一個大集群。主要用的是HA\DRS

存儲層雙活一般是選用華為的存儲，用的是Hypermetro這個特性，實現了RTO、RPO=0，實現存儲雙活。在寫IO上，上層下發一個寫IO，首先兩端存儲會有一個寫互斥，先拿到寫權限的一端，就先開始寫，寫完后，另一端也要寫完成后才會返回寫成功。讀的時候，用到了Ultra path特性，根據Ultra path特性選擇一條最優路徑，免網關的一個設計，不需要VIS，替代VIS去重新選擇一個最優路徑，減少設備和開銷。而且開啟了Hypermetro也可以異構存儲，把這些存儲陣列制成了vDISK統一使用。

*兩地三中心有哪些架構？有什么區別？

圖 1 同步+異步（級聯組網）

圖 2 異步+異步（級聯組網）

圖 3 同步+異步（並聯組網）

圖 4 異步+異步（並聯組網）

圖 5 多對一級聯組網

圖 6 雙活+遠程復制組網

*本地高可用與雙活數據中心的區別？（考到）

1.二者使用場景不同。本地高可用是同數據中心或者機房級的容災，雙活數據中心是異地進行的是區域級的容災；

2.本地高可用可以使用HyperMirror+SmartVirtualization 實現，雙活不可用；

3.多路徑：本地高可用使用HyperMetro時，多路徑軟件設置為負載均衡，而雙活配置本地站點優先；

4.雙活需要 GSLB、SLB、本地高可用不需要；

5.雙活需要考慮安全層、傳輸層等六個層次的雙活，而本地高可用可以不用考慮網絡層、傳輸層和安全層雙活，需要考慮應用、計算、存儲三個層面的雙活（網絡可以考慮，距離近不是重點）。

6. 成本：因為要考慮其他三層的物理設備，雙活成本較高

7. 保護范圍：本地高可用是數據中心內；雙活范圍，兩個數據中心最遠可以達到300KM

*本地高可用和主備區別

1. 保護范圍：本地只能數據中心內，主備可以同城或異地

2. 存儲層實現：本地高可用使用HyperMetro 主備使用存儲設備的遠程復制特性

3. RTO、RPO：本地高可用RTO和RPO理論上可以等於0 主備不一定

4. 工作方式：本地高可用同時提供業務，主備只有主提供業務

5. 負載均衡：主備無法實現負載均衡

*雙活和主備區別

1. 工作方式：雙活同時提供業務，主備只有主提供業務

2. 負載均衡：雙活實現負載均衡主備不可以

3. 資源利用率：主備只能達到50%；因為主工作時，備不工作

4. RTO和RPO：雙活可以理論上實現 RTO=0 RPO=0

5. 實現方式：存儲層，雙活是Hypermetro 主備是同/異步遠程復制

6. 范圍：異地主備可以> 3000KM

7. 網絡：雙活需要打通業務網絡主備不需要打通

8. 業務切換：雙活可以實現災難發生時自動切換站點，主備需要管理員手動拉起

*同步遠程復制和異步遠程復制的區別

同步遠程復制和異步遠程復制都可用於存儲系統的容災方案，實現數據的遠程備份。兩者的實現方式不同，並且應用於不同的業務場景。

實現方式

• 同步遠程復制是對主LUN進行寫操作的同時，將I/O寫請求發送到從LUN，當主LUN和從LUN都返回寫請求成功時，再返回主機I/O寫請求成功，從而實現主LUN數據和從LUN數據的緊密同步。

• 異步遠程復制是對主LUN進行寫操作的同時，在主站點記錄本次寫操作所修改的數據，待主LUN返回寫請求成功后，就返回主機寫請求成功。再通過用戶手動觸發或根據用戶設置的觸發條件自動進行同步操作，保證主LUN和從LUN數據一致。

應用場景

• 由於同步遠程復制對帶寬和數據時延有極高的要求，因此同步遠程復制主要應用於主設備和從設備相距較近的容災場景，如同城容災備份。

• 異步遠程復制對帶寬和數據時延的要求較低，因此異步遠程復制適用於長距離或網絡帶寬有限情況下的容災場景。

*雙活數據中心每一層都需要實現雙活嗎？

不需要每層都要實現雙活。雙活的定義是指兩數據中心同時可以對外提供業務。因此對業務而言可以通過主備的方式，也可以 AA 的部署方式。把主備放在不同側實現。

但是存儲層要雙活，因為要保障數據實時的同步，並且還要同時對外提供業務。

*同步復制原理

*異步復制原理

*HyperMetro的工作原理

1. 主機下發寫I/O到雙活管理模塊。

2. 系統記錄LOG。

3. 執行雙寫：雙活管理模塊同時將該寫 I/O寫入本端Cache和遠端Cache。

4. 本端Cache和遠端Cache 向雙活管理模塊返回寫 I/O 結果。

5. 雙寫結果處理：等待兩端Cache的寫處理結果都返回，才向主機返回寫I/O結果。

6. 判斷雙寫是否成功。

• 如果都寫成功：清除LOG。

• 如果有一端失敗：LOG轉換成DCL，記錄本端LUN和遠端LUN的差異數據。

*雲容災的服務（考到）

CSDR，生產存儲和容災存儲存儲復制。

CSHA，鏡像或雙活。

VHA 鏡像或雙活。

容災和備份有什么差別? 備份和容災的區別

版本一：

1.備份是容災的基礎，一般意義上，容災指的是不在同一機房的數據或應用系統備份，備份指的是本地的數據或系統備份

2.備份保護的是業務的數據，容災保護的是整套業務系統(有配套的主機、存儲、網絡設備等)

3.備份軟件處理后的數據格式不一致(通常存放在會進行重刪壓縮、歸檔)，必須恢復后才可使用，而復制或鏡像軟件處理后的數據格式不發生變化，直接掛載給主機即可使用。

4.兩者的數據保護的周期不一致，復制或鏡像的時間周期更短。

5.一般備份為數據保護的最后一條防線，偏向於歸檔這個層面更多。

版本二：

1. 對象區別：備份針對數據，容災針對 IT 系統（業務）

2. 層次上：備份是容災的基礎

3. 距離不同：容災兩站點距離較備份站點遠

介紹下華為容災全景圖

<關鍵點：

理解思路應該為：

范圍：本地、同城300km內、異地300km外

需求：RPO、RTO值(這是衡量容災解決方案的兩個關鍵指標，應多從這兩點思考、對比)

上述解決方案並非全部，只是在相應的容災范圍推薦的方案>

容災解決方案的存儲層實現

<關鍵點：

PPT中，華為的容災解決方案，更多側重點自身產品的實現，故存儲層是重點，且存儲層是數據容災最常用的手段，是容災的基礎。

在此，RPO、RTO值也是只考慮存儲層，整體解決方案的 RPO、RTO還需要考慮上層，如應用層、網絡層、計算層等

存儲層特性的選擇，取決於容災的范圍，進行決定的 RPO、RTO值

因VIS已停產，所以在上述表格未提及，VIS可以實現異步復制、雙活

兩地三中心容災解決方案，實際上是同城容災+異地容災的組合，具體 RPO、RTO值，需考慮災難級別，如數據中心級，那就考慮同城容災，如果是城市級，那就考慮異地容災

因異地容災距離比較大，通常已超過100km，甚至是 200km，所以只能采用異步遠程復制，並多采用廣域網鏈接

存儲特性對距離的要求

Hypermetro僅支持100km 內的容災，25km以外需采用波分設備減少光衰減及鏈路復用降低成本

同步遠程復制僅支持200km 內的容災

異步遠程復制無距離要求，可根據距離配置合適同步周期

RPO、RTO

RPO 標志系統能夠容忍的最大數據丟失量。系統容忍丟失的數據量越小，RPO 的值越小  RTO 標志系統能夠容忍的服務停止的最長時間。系統服務的緊迫性要求越高，RTO 的值越小

RPO、RTO是容災的兩個關鍵指標

RPO（Recovery Point Objective）：即數據恢復點目標，以時間為單位，即在災難發生時，系統和數據必須恢復到的時間點要求。RPO標志系統能夠容忍的最大數據丟失量。系統容忍丟失的數據量越小，RPO 的值越小。

RTO（Recovery Time Objective）：即恢復時間目標，以時間為單位，即在災難發生后，信息系統或業務功能從停止到必須恢復的時間要求。RTO 標志系統能夠容忍的服務停止的最長時間。系統服務的緊迫性要求越高，RTO的值越小。

RPO針對的是數據丟失，而RTO針對的是服務丟失，RTO和RPO的確定必須在進行風險分析和業務影響分析后根據不同的業務需求確定。

<補充： RPO、RTO的單位都是時間 >

兩地三中心有什么好處？

相對同城容災，它可以應對區域級的災難，具備更高的容災能力；

相對異地容災，在生產站點故障情況下，具備更小的 RPO或RTO。

什么是雙活數據中心？

雙活數據中心解決方案是指兩個數據中心同時處於運行狀態，同時承擔業務，提高數據中心的整體服務能力和系統資源利用率。兩個數據中心的數據實時保持一致，當單設備故障甚至一個數據中心故障時，業務自動切換，數據零丟失，業務零中斷。

<關鍵點：

雙活數據中心具備如下特點：

屬於同城容災方案

兩數據中心同時對外提供業務

互為容災、自動切換

數據零丟失、部分業務零中斷（業務不中斷不是必要標准）

如何實現六層雙活數據中心

雙活數據中心的存儲層一定要采用HyperMetro？

如果存儲層采用華為V3存儲設備的話，那么一定要采用HyperMetro。HyperMetro 能讓存儲層實現雙活，利用該特性可以配合應用層或計算層的自動切換的特點，保障數據的可用性及路徑最優。

<引伸：

HyperMetro提供的存儲雙活特點，才是關鍵。如果存儲層采用別用產品或方式能夠實現雙活或類雙活的目的，也是可以的。

本地高可用的組網和具體原理（雙活 HyperMetor）

包括本地雙活和本地鏡像本地。

雙活原理：

本地鏡像：

本地高可用組網圖

<補充：

上圖只考慮存儲層組網，采用交叉組網

SmartVirtualization+Hypermirror 組網相同

除了存儲層需要陣列特性配合外，主機層、應用層需要做集群。

主備容災的組網和具體原理（VRG 主備）

這里只介紹存儲側的組網，主機側的請看 FusionSphere 場景容災實現方式

注意：主備容災計算層是兩個 VRM

主備容災組網圖

<注意點：

存儲層網絡設備直接相連

存儲層需要打通，業務網絡不需要打通

FusionSphere主備容災存儲復制容災的組網

<補充：

圖一組網圖並不嚴謹，未實現兩BCManager通信。可以單獨網絡，可以通過打通兩管理平面實現。

存儲設備需要接入管理網絡，被BCManager接管

兩站點存儲設備通過兩站點的存儲層網絡設備鏈路實現數據容災

存儲復制容災實現的本地高可用、雙活、兩地三中心，與通用容災組網類似

FusionSphere主備容災主機復制容災的組網

<關鍵點：

圖一組網圖並不嚴謹，未實現兩BCManager通信。可以單獨網絡，可以通過打通兩管理平面實現。

存儲平面無需打通

BCManager無需管理存儲設備

建議給CNA節點單獨配置容災業管管理接口，讓其與 VRG通信，不配置則走CNA管理接口

VRG與VRG之間通信需要配置主機 IO復制平面

VRG需要被 BCManager 接管

HypereReplication的工作原理

同步遠程復制和異步遠程復制

<附加：

同步遠程復制主從端並不打快照，異步遠程復制主從端打快照。源端快照目的是定格數據，保障數據一致性，從端快照目的是假設異步失敗，可回滾到開始前的狀態。

雙活數據中心組網和具體原理

注意：雙活容災是一個 VRM

<關鍵點：

存儲層網絡設備直接相連，或通過波分設備相連

業務網絡核心交換機直接相連，或通過波分設備相連

存儲層需要打通，業務網絡也需要打通

采用波分設備原因為：減少光衰減及減少DCI 鏈路成本（由4對裸光纖降至2對）

雙活數據中心，除了存儲層需要陣列特性配合外，主機層、應用層需要做集群。

六層雙活：存儲層、主機層、應用層、網絡層、安全層、傳輸層

兩地三中心組網和具體原理。有什么區別？

FusionSphere 場景容災實現方式

主機層組網

背景：使用 FusionStorage 或者非華為存儲作為存儲資源時，不能使用存儲遠程復制與 BCManager 結合實現容災，所以將存儲復制功能上移，讓 FusionSphere 來實現主從數據中心的數據復制，此時 Fusionsphere 中需要部署 VRG（本質上是一個虛擬機，作用是充當虛擬化遠程復制網關，從而實現主機層遠程復制），從端同樣需要部署 VRG，作為數據復制的接收者。

原理：在使用主機復制容災時，一般在兩地分別建立生產站點和災備站點。利用 FusionCompute 虛擬化平台的 IO 分流技術，實現捕獲生產端虛擬機的實時 IO 數據並異步復制到災備端虛擬機卷中。

在生產站點和災備站點分別部署 VRG，主機中的 IOmirror 負責捕獲虛擬機 IO，生產端VRG聚合虛擬機的IO數據發送至災備端VRG，由災備端的VRG分發到指定主機的 WriteAgent上，由WriteAgent寫入虛擬機的卷中，完成虛擬機IO的遠程異步復制。

 陣列層容災：

1、利用底層 SAN 存儲的遠程復制特性，實現容災虛擬機的數據復制和保護。可支持同步遠程復制和異步遠程復制。

2、利用底層 SAN 存儲的 Hypermetro 雙活特性，實現容災虛擬機的數據一致性保護。

說華為有哪些容災產品

1、RD：數據庫應用容災

2、UltraVR：虛擬化容災

3、BCManager：數據庫，虛擬化應用等容災場景進行整合

4、BCManager eReplication：針對 OpenStack 雲 DC 容災

考試追問：

應用層數據庫應用是怎么實現雙活的？

數據庫軟件自己的技術比如oracle RAC、IBM DB2

同步遠程復制和雙活有什么區別？

同步遠程復制技術是主備容災使用的，它是寫復制時，對端也寫IO成功才返回寫成功。雙活是通過hypermetro特性實現的雙活數據中心，當一端故障時，業務自動切換到對端，業務訪問不中斷。

RTO RPO

實現方式

成本

存儲層實現方式

多路徑軟件設置

業務切換方式

業務網絡是否打通

資源利用率

工作方式

雙活數據中心一定是RTO和RPO等於零嗎？

不一定，理論等於0 是否真的等於0要看實際

使用smartvirtualization一定是異構存儲嗎？

對，SmartVirtualization將不同型號的華為存儲或異構存儲元數據映射到本端存儲中。

雙活主機層能不能雙活？

這里我沒答好說能，跟考官糾結了一會兒，他說不能的。兩站點ha，pro會大於零的

主機層比如fusionSphere的HA DRS DPM集群技術實現主機層高可用，但HA是虛擬機發生故障時才會HA，所以業務已經中斷RTO>0,所以RTO RPO是不是一定等於0，要看實際。

主機層形成集群怎么配置實現？

兩端站點加入一個集群，前提兩端站點網絡互通才能加入到一個集群

雙活數據中心的計算層如何實現？在你提到的fusionsphere大集群技術具體是怎么實現的？本地集群和跨集群有什么區別？

將兩個數據中心的服務器添加至同一個大集群。主要用的是HA\DRS。（不知道這樣答對不對。后面兩個問題我不知道）

雙活數據中心的網絡層如何實現的？

（這點考官在點評的時候說想聽的是通過VxLAN大二層技術實現）

數據中心間IP和FC網絡互通。SLB本地負載均衡器負責數據中心內的請求負載，GSLB負載數據中心間的請求負載。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。