簡介
我們在考慮MySQL數據庫的高可用架構時,主要考慮如下幾方面:
如果數據庫發生了宕機或者意外中斷等故障,能盡快恢復數據庫的可用性,盡可能的減少停機時間,保證業務不會因為數據庫的故障而中斷。
用作備份、只讀副本等功能的非主節點的數據應該和主節點的數據實時或者最終保持一致。
當業務發生數據庫切換時,切換前后的數據庫內容應當一致,不會因為數據缺失或者數據不一致而影響業務。
主從或主主半同步復制
使用雙節點數據庫,搭建單向或者雙向的半同步復制。在5.7以后的版本中,由於lossless replication、logical多線程復制等一些列新特性的引入,使得MySQL原生半同步復制更加可靠。
常見架構如下
通暢會和proxy,keepaliced等第三方軟件同時使用,即可以用來監控數據庫的健康,又可以執行一系列管理命令。如果主庫
發生故障,切換到備庫后仍然可以繼續使用數據庫。
優點
/*
1. 架構比較簡單, 使用原生半同步復制作為數據同步的依據;
2. 雙節點, 沒有主機宕機后的選主問題,直接切換即可;
3. 雙節點,需求資源少,部署簡單;
*/
缺點
/*
1. 完全依賴於半同步復制,如果半同步復制退化為異步復制,數據一致性無法得到保證.
2. 需要額外考慮haproxy,keepalived的高可用機制.
*/
半同步復制優化
半同步復制機制是可靠的,如果半同步復制一直是有效的, 那么便可以認為數據是一致的,但是由於網絡波動等一些客觀原因,導致半同步復制發生超時而切換為異步復制,那么這時不能保證數據的一致性,所以盡可能的保證半同步復制,便可提高數據的一致性.
該方案同樣使用雙節點架構,但是在原有半同復制的基礎上做了功能上的優化,使半同步復制的機制變的更加可靠.
雙通道復制
半同步復制由於發生超時后,復制斷開,當再次建立復制時,同時建立兩條通道,其中一條半同步復制通道從當前位置開始復制,保證從機知道當前主機執行的進度。另外一條異步復制通道開始追補從機落后的數據。當異步復制通道追趕到半同步復制的起始位置時,恢復半同步復制。
binlog文件服務器
搭建兩條半同步復制通道,其中連接文件服務器的半同步通道正常情況下不啟用,當主從的半同步復制發生網絡問題退化后,啟動與文件服務器的半同步復制通道。當主從半同步復制恢復后,關閉與文件服務器的半同步復制通道。
優點
/*
1. 雙節點,需求資源少,部署簡單
2. 架構簡單,沒有選主的問題,直接切換即可
3. 相對於原生復制,優化后的半同步復制更能保證數據的一致性.
*/
缺點
/*
1. 需要修改內核源碼或者使用mysql通信協議,需要對源碼有一定的了解,並能做一定程度上的二次開發.
2. 依舊依賴於半同步復制,沒有從根本上解決數據一致性問題.
*/
高可用架構優化
將雙節點數據庫擴展到多節點數據庫,或者多節點數據庫集群。可以根據自己的需要選擇一主兩從、一主多從或者多主多從的集群。
由於半同步復制,存在接收到一個從機的成功應答即認為半同步復制成功的特性,所以多從半同步復制的可靠性要優於單從半同步復制的可靠性。並且多節點同時宕機的幾率也要小於單節點宕機的幾率,所以多節點架構在一定程度上可以認為高可用性是好於雙節點架構。
但是由於數據庫數量較多,所以需要數據庫管理軟件來保證數據庫的可維護性。可以選擇MMM、MHA或者各個版本的proxy等等。常見方案如下
MHA+多節點集群
MHA Manager會定時探測集群中的master節點,當master出現故障時, 他可以自動將最新數據slave升級為master,然后將所有其他的slave重新指向為master, 整個故障轉移過程對應用程序完全透明.
MHA Node運行在每台MySQL服務器上,主要作用是切換時處理二進制日志,確保切換盡量少丟數據.
MHA也可以擴展到如下的多節點集群
優點
/*
1. 可以進行故障的自動檢測和轉移
2. 可擴展性較好,可以根據需要擴展MySQL的節點數量和結構.
3. 相對於雙節點的MySQL復制,三節點/多節點的MySQL發生不可用的概率更低.
*/
缺點
/*
1. 至少需要三節點,相對於雙節點需要更多的資源.
2. 邏輯較為復雜,發生故障后排查問題,定位問題更加困難.
3. 數據一致性仍然靠原生半同步復制保證,仍然存在數據不一致的風險.
4. 可能因為網絡分區發生腦裂現象.
*/
Zookeeper+Proxy
Zookeeper使用分布式算法保證集群數據的一致性,使用zookeeper可以有效的保證proxy的高可用性,可以較好的避免網絡分區現象的產生.
優點
/*
1. 較好的保證了整個系統的高可用性,包括proxy,MySQL.
2. 擴展性較好,可以擴展為大規模集群內
*/
缺點
/*
1. 數據一致性仍然依賴於原生的Mysql半同步復制.
2. 引入zk, 整個系統的邏輯變的更加復雜.
*/
共享存儲之SAN共享存儲
共享存儲實現了數據庫服務器和存儲設備的解耦,不同數據庫之間的數據同步不再依賴於MySQL的原生復制功能,而是通過磁盤數據同步手段,來保證數據的一致性.
SAN共享存儲
SAN的概念是允許存儲設備和處理器(服務器)之間建立直接的高速網絡(與LAN相比)連接,通過這種連接實現數據的集中式存儲,常用架構如下:
使用共享存儲時, MySQL服務器能夠正常掛載文件系統並操作,如果主庫發生宕機,備庫可以掛載相同的文件系統,保證主庫和備庫使用相同的數據.
優點
/*
1. 兩節點即可,部署簡單,切換邏輯簡單;
2. 很好的保證數據的強一致性;
3. 不會因為MySQL的邏輯錯誤發生數據不一致的問題;
*/
缺點
/*
1. 需要考慮共享存儲的高可用;
2. 價格昂貴;
*/
DRBD磁盤復制
DRBD是一種基於軟件、基於網絡的塊復制存儲解決方案,主要用於對服務器之間的磁盤、分區、邏輯卷等進行數據鏡像,當用戶將數據寫入本地磁盤時,還會將數據發送到網絡中另一台主機的磁盤上,這樣的本地主機(主節點)與遠程主機(備節點)的數據就可以保證實時同步。常用架構如下:
當本地主機出現問題,遠程主機上還保留着一份相同的數據,可以繼續使用,保證了數據的安全.
DRBD是Linux內核模塊實現的快級別的同步復制技術,可以與SAN達到相同的共享存儲效果.
優點
/*
1. 兩節點即可,部署簡單,切換邏輯簡單;
2. 相比於SAN存儲網絡,價格低廉;
3. 保證數據的強一致性;
*/
缺點
/*
1. 對IO性能影響較大
2. 從庫不能提供讀操作
*/
MySQL Cluster
MySQL cluster是官方集群的部署方案,通過使用NDB存儲引擎實時備份冗余數據,實現數據庫的高可用性和數據一致性。
優點
/*
1. 全部使用官方組件,不依賴第三方軟件
2. 可以實現數據的強一致性
*/
缺點
/*
1. 國內使用的較少;
2. 配置較復雜,需要使用NDB存儲引擎,與MySQL常規引擎存在一定差異;
3. 至少三節點;
*/
Galera
基於Galera的MySQL高可用集群,是多住數據同步的MySQL集群解決方案,使用簡單,沒有單點故障,可用性高,常見架構如下:
優點
/*
1. 多主寫入,無延遲復制,能保證數據強一致性;
2. 有成熟的社區,有互聯網公司在大規模的使用;
3. 自動故障轉移,自動添加,剔除節點;
*/
缺點
/*
1. 需要為原生MySQL節點打wsrep補丁;
2. 只支持innodb存儲引擎;
3. 至少三節點;
*/
Proxs
Paxos 算法解決的問題是一個分布式系統如何就某個值(決議)達成一致。這個算法被認為是同類算法中最有效的。Paxos與MySQL相結合可以實現在分布式的MySQL數據的強一致性。常見架構如下:
優點
/*
1. 多主寫入,無延遲復制,能保證數據的強一致性;
2. 有成熟理論基礎;
3. 自動故障轉移,自動添加,剔除節點;
*/
缺點
/*
1. 只支持innodb存儲引擎;
2. 至少三節點;
*/
小結
隨着人們對數據一致性要求不斷的提高,越來越多的方法被嘗試用來解決分布式數據一致性的問題,如MySQL自身的優化、MySQL集群架構的優化、Paxos、Raft、2PC算法的引入等。
而使用分布式算法用來解決MySQL數據庫數據一致性問題的方法,也越來越被人們所接受,一系列成熟的產品如PhxSQL、MariaDB Galera Cluster、Percona XtraDB Cluster等越來越多的被大規模使用。
隨着官方MySQL Group Replication的GA,使用分布式協議來解決數據一致性問題已經成為了主流的方向。期望越來越多優秀的解決方案被提出,MySQL高可用問題也可以被更好的解決。
文章絕大多數來自