Hadoop集群datanode死掉或者secondarynamenode進程消失處理辦法

本文轉載自查看原文 2014-09-11 14:16 2348 hadoop

當Hadoop集群的某單個節點出現問題時，一般不必重啟整個系統，只須重啟這個節點，它會自動連入整個集群。

在壞死的節點上輸入如下命令即可：

hadoop-daemon.sh start datanode

hadoop-daemon.sh start secondarynamenode

案例如下：

hadoop節點死機，能ping通，ssh連接不上

案例：

時間：2014/9/11 上午

表現：hadoop的web界面上TC-hadoop018節點dead

症狀：節點TC-hadoop018的ssh連接不上

解決辦法：

通知機房管理員重啟機器，

關閉防火牆查看狀態：/etc/init.d/iptatbles status 關閉：/etc/init.d/iptables stop

hadoop-daemon.sh stop datanode

hadoop-daemon.sh stop tasktracker

hadoop-daemon.sh start datanode

hadoop-daemon.sh start tasktracker

至此，啟動成功

【慎用】必要的時候，查看web界面，如果沒有正在運行的job，直接重啟整個集群。

Hadoop的secondarynamenode端口50090不通

案例：

時間：2014/9/11 下午

表現：sos2報警提示123.125.244.6_50090端口報警

症狀：jps命令123.125.244.6機器上SecondaryNameNode進程沒有

解決辦法：

hadoop-daemon.sh stop secondarynamenode

hadoop-daemon.sh start secondarynamenode

至此，啟動成功

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Hadoop集群對datanode宕機后的處理機制源碼閱讀 hadoop在子節點上沒有datanode進程虛擬機hadoop集群啟動時DataNode進程缺失【Hadoop故障處理】全分布下，DataNode進程正常啟動，但是網頁上不顯示，並且DataNode節點為空 hadoop集群運行jps命令以后Datanode節點未啟動的解決辦法 hadoop集群中namenode超時無法連接datanode的原因和解決辦法 Hadoop 2.0安裝以及不停集群加datanode hadoop2.7.x集群模式下secondarynamenode啟動不了 Hadoop中DataNode沒有啟動解決辦法 hadoop集群基本進程