spark開發常見問題之一：java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.

本文轉載自查看原文 2019-06-29 12:10 6208 winutils/ spark/ Spark/ hadoop

最近在學習研究pyspark機器學習算法，執行代碼出現以下異常：

19/06/29 10:08:26 ERROR Shell: Failed to locate the winutils binary in the hadoop binary path
java.io.IOException: Could not locate executable null\bin\winutils.exe in the Hadoop binaries.
at org.apache.hadoop.util.Shell.getQualifiedBinPath(Shell.java:379)
at org.apache.hadoop.util.Shell.getWinUtilsPath(Shell.java:394)
at org.apache.hadoop.util.Shell.<clinit>(Shell.java:387)
at org.apache.hadoop.util.StringUtils.<clinit>(StringUtils.java:80)
...........
19/06/29 10:08:26 WARN NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
Using Spark's default log4j profile: org/apache/spark/log4j-defaults.properties

從程序運行度方面來說，這個異常並不影響spark程序的繼續執行。但是作為一個程序員看到異常就如出現bug，必須讓這種異常消失！

分析異常：根據提示應該是Hadoop binaries.中缺少winutils.exe這個配置。

解決方法：

1.首先檢查本地window環境是否已經安裝hadoop，若沒有則先配置hadoop環境變量

1）下載Hadoop，我本次操作使用的是hadoop-2.7.3，當然你可以根據自己需求去官網下載

官網下載地址：

網盤分享我使用的版本：

鏈接: https://pan.baidu.com/s/1-ssNBynSzrC5iG5ozwqAUA 提取碼: zdu5

2）配置windows環境變量。本機是windows10系統

先添加HADOOP_HOME配置