當執行 ./bin/hdfs dfs -put ./etc/hadoop/*.xml ../input 打算將xml移動到input文件夾中出錯
rogn@ubuntu:~/Downloads$ hdfs dfs -put ./test.txt hdfs:///rogn/input 2020-06-10 17:39:41,266 WARN hdfs.DataStreamer: DataStreamer Exception org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /rogn/input/test.txt._COPYING_ could only be written to 0 of the 1 minReplication nodes. There are 0 datanode(s) running and 0 node(s) are excluded in this operation.
看它的報錯信息好像是節點沒有啟動,但是我的節點都啟動起來了,使用jps也能查看到節點信息。
使用hadoop dfsadmin -report命令查看磁盤使用情況,發現出現以下問題:
Configured Capacity: 0 (0 B) Present Capacity: 0 (0 B) DFS Remaining: 0 (0 B) DFS Used: 0 (0 B) DFS Used%: NaN% Under replicated blocks: 0 Blocks with corrupt replicas: 0 Missing blocks: 0 ------------------------------------------------- Datanodes available: 0 (0 total, 0 dead)
節點下存儲空間都是空的,問題應該就是出現在這了。
查閱資料發現造成這個問題的原因可能是使用hadoop namenode -format格式化時格式化了多次造成那么spaceID不一致,解決方案:
1、停止集群(切換到/sbin目錄下)
$./stop-all.sh
2、刪除在hdfs中配置的data目錄(即在core-site.xml中配置的hadoop.tmp.dir對應文件件)下面的所有數據;
$ rm -rf /home/hadoop/hdpdata/*
3、重新格式化namenode(切換到hadoop目錄下的bin目錄下)
$ ./hadoop namenode -format
4、重新啟動hadoop集群(切換到hadoop目錄下的sbin目錄下)
$./start-all.sh
在使用hadoop dfsadmin -report查看使用情況,結果如下圖所示:

原文鏈接:https://blog.csdn.net/weiyongle1996/article/details/74094989
