問題描述:
搭建好的集群,啟動時發現有一台datanode掛掉了,這時檢查了一下配置,排除此類原因。最后,想起了如果集群是第一次啟動,需要格式化NameNode(注意格式化之前,一定要先停止上次啟動的所有namenode和datanode進程,然后再刪除data和log數據),恰好掛掉的那台機器就是這個原因,立馬刪除了data下的數據,同時刪除其他兩台對應目錄下的數據,重新操作,即可解決。
本集群的基本信息如下:
hadoop101 | hadoop103 | hadoop104 | |
HDFS | NameNode DataNode |
DataNode | DataNode SecondaryNameNode |
YARN | NodeManager | ResourceManager NodeManager |
NodeManager |
(PS:掛掉的是hadoop104,jps時沒有datanode信息,刪除data下的數據即可解決)