ResourceManager 高可用機制架構
在Hadoop2.4 中添加了Active/Standby ResourceManager 的方式來解決ResourceManager 的單點故障問題。
Active ResourceManager 會將狀態信息寫入到ZooKeeper 集群之中,如果Active ResourceManager 掛了,那么可以將Standby ResourceManager 切換成Active ResourceManager(手動切換和自動切換)
ResourceManager HA 是通過Active/Standby 架構模式實現的,在任意時刻只有一個ResourceManager 處於 Active狀態,其余的則處於Standby 狀態,等待Active ResourceManager 發生故障時切換用。
自動切換方式:通過內嵌的基於ZooKeeper 的 ActiveStandbyElector 來決定哪個 ResourceManager 處於Active狀態,當Active ResourceManager 出現故障時,其它的ResourceManager 將被自動選舉,選舉出來的ResourceManager 會被切換為 Active 狀態。
手動切換方式:
查看rm 狀態
yarn rmadmin -getServiceState rm
切換rm
yarn rmadmin -transitionToStandby rm