cdh因为无法恢复yarn任务导致yarn ResourceManager无法重启


1 因为内存溢出问题导致yarn ResourceManager无法启动,多次重启仍然失败

 

2 查询到原因是因为重启rm的时候,会尝试恢复之前所有的yarn任务,但是之前内存溢出的原因就是因为yarn任务的内存压力过大导致。所以不断重启也没用。

 

3 解决方案,进入zookeeper控制台,找到保存yarn任务的地方,删除yarn任务信息,待resourceManager启动成功后,重新提交之前的任务。

  sh /opt/cloudera/parcels/CDH-5.16.1-1.cdh5.16.1.p0.3/lib/zookeeper/bin/zkCli.sh

      ls /rmstore/ZKRMStateRoot/RMAppRoot

     

 

 

rmr /rmstore/ZKRMStateRoot/RMAppRoot/对应的任务id

 

4 之后重启成功,重新提交任务也可以运行了。

     

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM