1. 災備
什么是災備?
災備是容災和備份的簡稱。 災備方案=容災方案+備份方案
- 容災: 將一套系統部署在不同的可用區【同城或者異地】,互相之間可以進行健康狀態監視和高可用切換,當一個可用區出現異常停止工作時,整個應用系統可以切換到另一處,不影響功能的正常使用。側重數據同步和系統持續可用。
- 備份:指將應用系統產生的重要數據制作一份或多分拷貝文件,增加數據的安全。側重數據的備份和保存。
災備的關鍵指標:
- RTO-恢復時間目標:指在系統出現宕機到恢復業務服務的時間,RTO越低說明系統的恢復能力越高,相對的成本也要更大。
- RPO-恢復點目標:指災難出現后,系統進行數據恢復,恢復得來的數據對應時間點稱為RPO,反映數據丟失量,RPO越小說明企業允許丟失的數據越少。比如 “RPO = 1 天” 意味着恢復時使用一天前的數據,那么一天之內的數據就丟失了。
備份的分類
- 備份內容
- 操作系統備份
- 數據備份
- 備份數據量
- 全量備份:備份所有數據
- 增量備份:根據上一次備份所作的增量備份(在上一次備份的基礎上備份)
- 差異備份:根據上一次全量備份所作的差異備份(差異備份只對比上一次全量)
- 備份的形式
- 物理備份:備份真實數據
- 邏輯備份:備份操作記錄
- 備份時是否需要停服務
- 冷備份:將數據以隔離的方式進行保存,不受原數據影響,數據恢復慢,解決人為誤操作。
- 熱備份:搭建冗余環境,恢復速度快,不能解決人為誤操作。
2. 高可用(HA)
高可用的實現形式
- Active/Passive HA:集群只包括兩個節點簡稱主備。在這種配置下,系統采用主和備用機器來提供服務,系統只在主設備上提供服務。在主設備故障時,備設備上的服務被啟動來替代主設備提供的服務。典型地,可以采用 CRM 軟件比如 Pacemaker 來控制主備設備之間的切換,並提供一個虛機 IP 來提供服務。
- Active/Active HA:集群只包括兩個節點時簡稱雙主,包括多節點時成為多主(Multi-master)。在這種配置下,系統在集群內所有服務器上運行同樣的負載。以數據庫為例,對一個實例的更新,會被同步到所有實例上。這種配置下往往采用負載均衡軟件比如 HAProxy 來提供服務的虛擬 IP。