spark 与 Hadoop 融合后 Neither spark.yarn.jars nor spark.yarn.archive is set


参考文献:

http://blog.csdn.net/lxhandlbb/article/details/54410644

 

 

每次提交Spark任务到yarn的时候,总会出现uploading resource(打包spark jars并上传)到hdfs上。

恶劣情况下,会在这里卡住很久。

 

 

 

 

解决:
在hdfs上创建目录:
hdfs dfs -mkdir   /spark_jars

上传spark的jars(spark1.6 只需要上传spark-assembly-1.6.0-SNAPSHOT-hadoop2.6.0.jar)


hdfs dfs -put /opt/spark/jars/*    /spark_jars


在spark的conf的spark-default.conf


添加配置 :

spark.yarn.jars=hdfs://master:9000/spark_jars/*
#spark.yarn.jars=/opt/spark-2.1.1-bin-hadoop2.7/jars/*

 

 


即可解决。不会出现这个问题。

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM