1 因為內存溢出問題導致yarn ResourceManager無法啟動,多次重啟仍然失敗
2 查詢到原因是因為重啟rm的時候,會嘗試恢復之前所有的yarn任務,但是之前內存溢出的原因就是因為yarn任務的內存壓力過大導致。所以不斷重啟也沒用。
3 解決方案,進入zookeeper控制台,找到保存yarn任務的地方,刪除yarn任務信息,待resourceManager啟動成功后,重新提交之前的任務。
sh /opt/cloudera/parcels/CDH-5.16.1-1.cdh5.16.1.p0.3/lib/zookeeper/bin/zkCli.sh
ls /rmstore/ZKRMStateRoot/RMAppRoot
rmr /rmstore/ZKRMStateRoot/RMAppRoot/對應的任務id
4 之后重啟成功,重新提交任務也可以運行了。