摘要:MapReduce Service 集群使用NTP進行時鍾同步。本文簡要介紹了MapReduce Service集群NTP機制及NTP的配置方式。
本文分享自華為雲社區《MapReduce Service更換集群外部時鍾源》,作者:tangyuxiaobao29。
MapReduce Service 集群NTP機制
1、FusionInsight的主OMS節點向NTP外部時鍾源同步
2、所有業務節點向OMS主節點同步
基於上述原理可以看出,實際上整個集群都是最終向NTP時鍾源同步的,這樣做的最大好處是:無論何時,整個集群內的時鍾始終都是與主OMS同步的,至少保證了集群內節點時鍾同步。如果外部ntp時鍾源沒任何問題,那么整個集群也是與外部ntp時鍾源同步的!
MapReduce Service 配置NTP服務器實現說明
一、安裝FusionInsight Manager階段配置NTP服務器
FusionInsight Manager安裝配置文件install.ini中通過ntp_server_ip參數設置外部NTP時鍾服務器IP地址。該參數可選。
當不設置該參數,系統默認使用主管理節點作為NTP服務器。安裝后主oms節點ntp狀態
集群內非主oms節點ntp狀態
當設置該參數且存在多個NTP服務器,需要以英文逗號隔開各IP,如192.168.34.185。安裝后主oms節點ntp狀態
集群內非主oms節點ntp狀態不變
二、安裝后更換集群NTP服務器
1、操作場景
安裝FusionInsight Manager管理系統后,如果未配置NTP服務器或已配置的NTP不再使用,管理員可以為集群重新指定或者更換新的NTP服務器,使集群從新的NTP時鍾源同步時間。
2、對系統的影響
更換NTP服務器是高危操作,更換后集群時間可能將會變化。
更換NTP服務器前NTP服務器與集群當前時間偏差大於150s,則需先停止集群,防止數據丟失。停止集群期間服務無法訪問。
3、前提條件
已准備新的NTP服務器並獲取IP地址,並設置好集群與新NTP服務器的網絡。請確保服務器的NTP服務狀態正常,否則將導致操作失敗。
IPv4組網的集群只支持配置IPv4網絡的外部時鍾源,IPv6組網的集群只支持配置IPv6網絡的外部時鍾源。
如果集群使用IPv4模式,外部時鍾源只能用IPv4地址;如果集群使用IPv6模式,外部時鍾源只能用IPv6地址。
4、操作步驟
1.登錄FusionInsight Manager,查看是否存在未清除的告警
•是,請參見“故障管理”修復告警。告警處理完畢后,執行2。
•否,執行2。
2.使用omm用戶分別登錄主備管理節點。
3.在主管理節點執行以下命令查看管理平面網關。
cat ${BIGDATA_HOME}/om-server/OMS/workspace/conf/oms-config.ini | grep om_gateway
4.在主備管理節點分別執行ping 管理平面網關,檢查節點是否與管理平面網關連通
•是,執行5。
•否,請聯系網絡管理員修復網絡故障,處理完畢后,執行5。
5.在主管理節點執行以下命令,檢查集群時間與新的NTP服務器時間偏差。單位為秒。
例如,檢查與NTP服務器“192.168.34.185”的時間差,執行ntpdate -d 192.168.34.185,界面顯示:
其中0.034136表示時間偏差。正數表示NTP服務器時間比集群當前時間快,負數表示NTP服務器時間比集群當前時間慢。
6.檢查時間偏差的絕對值是否超過“150S”。
•是,執行7。
•否,時間偏差的絕對值不超過“150”,以omm用戶執行9。
7.確認是否可以停止集群。
•是,停止上層業務並停止集群,然后執行8。
•否,任務結束。
8.確認NTP服務器時間是否比集群當前時間慢
•是,NTP服務器時間慢,停止集群界面顯示“操作成功”后需等待,間隔大約為5得到的時間偏差,再以omm用戶執行10。
•否,NTP服務器時間快,停止集群界面顯示“操作成功”后直接以omm用戶執行10。
9.在主管理節點執行以下命令,更換NTP服務器,任務結束。
sh ${BIGDATA_HOME}/om-server/om/bin/tools/modifyntp.sh --ntp_server_ip 192.168.34.185
執行完畢后檢查ntp狀態
10.在主管理節點執行以下命令,從NTP服務器“192.168.34.185”立即強制同步時間並更換NTP服務器,任務結束。
sh ${BIGDATA_HOME}/om-server/om/bin/tools/modifyntp.sh --ntp_server_ip 192.168.34.185 --force_sync_time
說明
•NTP服務器IP地址不可以設置為集群內節點IP地址,否則可能會導致節點與主備oms節點業務網絡斷連。
•當前最多允許配置2個NTP服務器以主備方式提供服務,可以用“,”將不同服務器分開
•如果停止了集群,在更換NTP服務器后需要重新啟動集群。
•未執行強制同步時間命令時,大約以200ms/h的速率進行時間同步。
•執行強制同步時間命令后,集群節點大約需要5分鍾完成時間同步。