相關內容簡體繁體

利用HDFS來解決Spark On Yarn模式解決Jar亂飛情況

本文轉載自查看原文 2020-04-29 09:00 854 Spark

Spark的jar包比較多，如果直接修改spark的jars目錄中的jar可能對用戶造成jar包沖突，也不利於管理，因為可以利用HDFS存儲功能解決jar問題

1、在本地創建zip文件，壓縮jar包

# 進入到spark的jars目錄，在spark的jars目錄下壓縮包
zip spark.zip ./*

2、HDFS上創建存放spark jar目錄

hdfs dfs -mkdir -p /spark-yarn/jars

3、將$SPARK_HOME/jars下的spark.zip包上傳至剛健的HDFS路徑

[hadoop@hadoop jars]$ hdfs dfs -put ./spark.zip /spark-yarn/jars/

4、在spark-defaults.conf中添加(也可以在啟動時候 -conf 指定)

spark.yarn.archive hdfs://ruozedata001:9000/spark-jars/spark.zip

5、查看Spark log

yarn log -applicationID xxx

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 spark優化——依賴包傳入HDFS_spark.yarn.jar和spark.yarn.archive的使用解決Spark On Yarn yarn-cluster模式下的No Suitable Driver問題 spark on yarn運行產生缺jar包錯誤及解決辦法 spark on yarn任務提交緩慢解決 spark on yarn任務提交緩慢解決 spark on yarn任務提交緩慢解決 Spark on yarn模式 Spark On Yarn中spark.yarn.jar屬性的使用 spark on yarn提交任務時報ClosedChannelException解決方案 Hadoop 運行 yarn jar 單詞統計問題解決

粵ICP備18138465號 © 2018-2026 CODEPRJ.COM