mac下hadoop環境的搭建以及碰到的坑點

本文轉載自查看原文 2020-08-24 16:39 567

提示：這里有Exit code: 127 Stack trace: ExitCodeException exitCode=127: 錯誤的解決的方法，在文章最后面

一、首先要配置好java環境
下載地址：http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html
mac電腦直接jdk-8u144-macosx-x64.dmg一鍵安裝jdk
然后配置jdk環境，

JAVA_HOME=/Library/Java/JavaVirtualMachines/jdk1.8.0_144.jdk/Contents/Home CLASSPAHT=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar PATH=$JAVA_HOME/bin:$PATH： export JAVA_HOME export CLASSPATH export PATH

二、ssh配置
首先確認能夠遠程登錄
系統偏好設置－共享 -遠程登錄

ssh-keygen -t rsa
Press enter for each line 提示輸入直接按回車就好
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod og-wx ~/.ssh/authorized_keys
ssh localhost
如果ssh localhost還需要密碼查看一下你.ssh目錄的權限
.ssh的父目錄的權限問題（我的問題就出現在這里）：.ssh的父目錄文件權限應該是755，即所屬用戶的用戶文件（/home下屬的一個用戶文件）

執行chmod 755 ~/.ssh

三、安裝配置hadoop文件
下載地址：http://hadoop.apache.org/releases.html
http://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/hadoop-2.8.1/hadoop-2.8.1.tar.gz

tar -zxvf hadoop-2.8.1.tar.gz 
cd hadoop-2.8.1

修改配置文件配置文件在hadoop目錄下的/etc/hadoop
1.修改core-site.xml 文件

<configuration> <!-- 指定HDFS老大（namenode）的通信地址 --> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> <!-- 指定hadoop運行時產生文件的存儲路徑 --> <property> <name>hadoop.tmp.dir</name> <value>/Users/chenxun/software/hadoop-2.8.1/temp</value> </property> </configuration>

2.修改hadfs-site.xml
默認副本數3，修改為1，dfs.namenode.name.dir指明fsimage存放目錄，多個目錄用逗號隔開。dfs.datanode.data.dir指定塊文件存放目錄，多個目錄逗號隔開

<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/Users/chenxun/software/hadoop-2.8.1/tmp/hdfs/name</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/Users/chenxun/software/hadoop-2.8.1/tmp/hdfs/data</value> </property> <property> <name>dfs.namenode.secondary.http-address</name> <value>localhost:9001</value> </property> <property> <name>dfs.webhdfs.enabled</name> <value>true</value> </property> </configuration>

3.yarn配置
mapred-site.xml

<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> <property> <name>mapreduce.admin.user.env</name> <value>HADOOP_MAPRED_HOME=$HADOOP_COMMON_HOME</value> </property> <property> <name>yarn.app.mapreduce.am.env</name> <value>HADOOP_MAPRED_HOME=$HADOOP_COMMON_HOME</value> </property> <property> <name>mapreduce.application.classpath</name> <value> /Users/chenxun/software/hadoop-2.8.1/etc/hadoop, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/common/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/common/lib/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/hdfs/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/hdfs/lib/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/mapreduce/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/mapreduce/lib/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/yarn/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/yarn/lib/* </value> </property> </configuration>

yarn-site.xml

<configuration> <!-- Site specific YARN configuration properties --> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.application.classpath</name> <value> /Users/chenxun/software/hadoop-2.8.1/etc/hadoop, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/common/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/common/lib/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/hdfs/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/hdfs/lib/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/mapreduce/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/mapreduce/lib/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/yarn/*, /Users/chenxun/software/hadoop-2.8.1/share/hadoop/yarn/lib/* </value> </property> </configuration>

四、配置hadoop環境變量，可能需要重新編譯native library

vim ~/.bash_profile

export HADOOP_HOME=/Users/chenxun/software/hadoop-2.8.1 export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin export LD_LIBRARY_PATH=$HADOOP_HOME/lib/native/ export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib/native:$HADOOP_COMMON_LIB_NATIVE_DIR"

**上面配置基本完成，一般沒什么問題了。可以開始運行你的hadoop了，直接看第五步好了，有問題繼續往下看。

**

下面步驟在你運行hadoop的過程可能碰到，如果你碰到了再回頭看這，：
在mac可能還要重新編譯hadoop的運行用到動態庫；這個時候肯能要配置maven環境，根據自己的maven安裝路徑配置maven環境，再重新編譯/lib/native下動態要用到
如果你在運行出現下面的情況就需要重新編譯動態庫：
WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform… using builtin-java classes where applicable
參考鏈接：http://blog.csdn.net/tterminator/article/details/51779689
參考二：Mac下 hadoop-2.7.0編譯過程記錄http://blog.csdn.net/beijihukk/article/details/53782508?utm_medium=referral&utm_source=itdadao

先下載好hadoop源碼：hadoop-2.8.1-src
重新編譯之前需要安裝
protobuf
和maven以及cmake，自己百度搜索安裝即可
protobuf安裝方法如下:

1. protobuf 2.5版本的brew安裝方法 $ brew search protobuf protobuf protobuf-c protobuf-swift homebrew/php/php53-protobuf homebrew/php/php56-protobuf homebrew/php/php54-protobuf homebrew/versions/protobuf250 homebrew/php/php55-protobuf homebrew/versions/protobuf260 $ brew install homebrew/versions/protobuf250

配置maven環境

export M2_HOME=/Users/chenxun/software/apache-maven-3.5.0

編譯動態庫過程出現下面的錯誤可能是zlib沒安裝
也可能是openssl沒設置好，設置openssl的方法如下（我的mac，你根據你自己的openssl安裝路徑設置）

export OPENSSL_ROOT_DIR=/usr/local/Cellar/openssl/1.0.2k export OPENSSL_INCLUDE_DIR=/usr/local/Cellar/openssl/1.0.2k/include

**開始編譯native庫，命令如下：
mvn package -Pdist,native -DskipTests -Dtar**

將編譯出的native library復制到下載的二進制版本的hadoop-2.8.1相應目錄中
編譯出的native library庫的位置為
hadoop-2.8.1-src/hadoop-dist/target/hadoop-2.8.1/lib/native
拷貝到二進制版本的hadoop-2.8.1的目錄
hadoop-2.8.1/lib/native

修改/etc/hadoop/hadoop-env.sh配置

 export HADOOP_OPTS=”$HADOOP_OPTS -Djava.net.preferIPv4Stack=true -Djava.library.path=/hadoop-2.6.0/lib/native”

重新啟動Hadoop

此時就不會出現本文開頭處的那個警告了。

五、運行hadoop 以及hadoop命令簡單的介紹
格式化HDFS

hdfs namenode -format

一次啟動hadoop所有進程：

start-all.sh

打開 http://localhost:50070 進入hdfs管理頁面
打開 http://localhost:8088 進入hadoop進程管理頁面

hadoop命令簡單介紹：
創建目錄

hdfs dfs -mkdir -p /user/chenxun/input

查看：
hadoop fs -ls /user/chenxun/

先自己隨便建一個file.txt文件，在文件隨便寫點東西，如下：

vim file.txt hadoop chenxun hadoop chen

把這個文件用命令上傳你剛才建文件input下面：命令如下：

hdfs dfs -put ./file.txt input

用命令查看一下是否成功：如果成功你在input下面看到file.txt文件

hadoop fs -ls /user/chenxun/input

這個時候你測試hadoop提供的wordcount例子：執行下面的語句（如果出現錯誤不要着急往文章后面看解決方法）

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.1.jar wordcount /user/chenxun/input/file.txt output

運行過程如下

17/10/14 01:55:26 INFO client.RMProxy: Connecting to ResourceManager at /0.0.0.0:8032 17/10/14 01:55:28 INFO input.FileInputFormat: Total input files to process : 1 17/10/14 01:55:28 INFO mapreduce.JobSubmitter: number of splits:1 17/10/14 01:55:28 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1507912953622_0017 17/10/14 01:55:28 INFO impl.YarnClientImpl: Submitted application application_1507912953622_0017 17/10/14 01:55:28 INFO mapreduce.Job: The url to track the job: http://chen.local:8088/proxy/application_1507912953622_0017/ 17/10/14 01:55:28 INFO mapreduce.Job: Running job: job_1507912953622_0017 17/10/14 01:55:36 INFO mapreduce.Job: Job job_1507912953622_0017 running in uber mode : false 17/10/14 01:55:36 INFO mapreduce.Job: map 0% reduce 0% 17/10/14 01:55:41 INFO mapreduce.Job: map 100% reduce 0% 17/10/14 01:55:47 INFO mapreduce.Job: map 100% reduce 100% 17/10/14 01:55:47 INFO mapreduce.Job: Job job_1507912953622_0017 completed successfully 17/10/14 01:55:48 INFO mapreduce.Job: Counters: 49 File System Counters FILE: Number of bytes read=44 FILE: Number of bytes written=276523 FILE: Number of read operations=0 FILE: Number of large read operations=0 FILE: Number of write operations=0 HDFS: Number of bytes read=141 HDFS: Number of bytes written=26 HDFS: Number of read operations=6 HDFS: Number of large read operations=0 HDFS: Number of write operations=2 Job Counters Launched map tasks=1 Launched reduce tasks=1 Data-local map tasks=1 Total time spent by all maps in occupied slots (ms)=3032 Total time spent by all reduces in occupied slots (ms)=3133 Total time spent by all map tasks (ms)=3032 Total time spent by all reduce tasks (ms)=3133 Total vcore-milliseconds taken by all map tasks=3032 Total vcore-milliseconds taken by all reduce tasks=3133 Total megabyte-milliseconds taken by all map tasks=3104768 Total megabyte-milliseconds taken by all reduce tasks=3208192 Map-Reduce Framework Map input records=4 Map output records=4 Map output bytes=43 Map output materialized bytes=44 Input split bytes=114 Combine input records=4 Combine output records=3 Reduce input groups=3 Reduce shuffle bytes=44 Reduce input records=3 Reduce output records=3 Spilled Records=6 Shuffled Maps =1 Failed Shuffles=0 Merged Map outputs=1 GC time elapsed (ms)=134 CPU time spent (ms)=0 Physical memory (bytes) snapshot=0 Virtual memory (bytes) snapshot=0 Total committed heap usage (bytes)=306708480 Shuffle Errors BAD_ID=0 CONNECTION=0 IO_ERROR=0 WRONG_LENGTH=0 WRONG_MAP=0 WRONG_REDUCE=0 File Input Format Counters Bytes Read=27 File Output Format Counters Bytes Written=26

再執行看看執行結果：

hadoop fs -ls /user/chenxun/output

這時候你看到：

Found 2 items -rw-r--r-- 1 chenxun supergroup 0 2017-10-14 01:55 /user/chenxun/output/_SUCCESS -rw-r--r-- 1 chenxun supergroup 26 2017-10-14 01:55 /user/chenxun/output/part-r-00000

接下來真正看一下你的單詞統計結果：

hadoop fs -cat /user/chenxun/output/part-r-00000

因為我的file.txt文件內容是

[chenxun@chen.local 11:13 ~/software/hadoop-2.8.1]$cat file.txt hadoop chenxun hadoop chen

所有統計結果如下：

chen    1
chenxun 1
hadoop  2

Exit code: 127 Stack trace: ExitCodeException exitCode=127: 的錯誤解決方法如下：

六、如果你在第五步執行過程出現錯誤：Exit code: 127 Stack trace: ExitCodeException exitCode=127: 不要着急這里了解決方法：

今天在Mac配置偽分布式環境。部署完畢后，運行MapReduce程序，程序運行剛開始沒有問題， 但是到啟動Map Task時，就報錯誤，報exitCode: 127錯誤。 錯誤日志如下： 15/04/06 00:08:01 INFO mapreduce.Job: Job job_1428250045856_0002 failed with state FAILED due to: Application application_1428250045856_0002 failed 2 times due to AM Container for appattempt_1428250045856_0002_000002 exited with exitCode: 127 due to: Exception from container-launch: org.apache.hadoop.util.Shell$ExitCodeException: org.apache.hadoop.util.Shell$ExitCodeException: at org.apache.hadoop.util.Shell.runCommand(Shell.java:505) at org.apache.hadoop.util.Shell.run(Shell.java:418) at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:650) 解決辦法： 1 從錯誤日志上看應該是某個Shell命令在Mac上沒有找到。 2 查看每個程序的日志：hadoop-2.3.0/logs/userlogs/application_1428247759749_0002/container_1428247759749_0002_02_000001中的錯誤日志： /bin/bash: /bin/java: No such file or directory 可以看到：/bin/java 的命令沒有找到。 建立一個軟鏈接，鏈接到java程序即可。 上文中的日志文件和異常中的文件名對應不上，這個是我編寫時的問題， 實際可以根據日志中的文件名找到具體的錯誤文件。但是整個流程，是這個。

是因為Hadoop默認檢查/bin/java路徑下的java，可是Mac的Java不是裝這里的，它的路徑是/usr/bin/java。你不信啊，那你輸入命令$ /usr/bin/java -version, 看看是不是會出現類似以下的信息：

Java version "1.8.0_45" Java(TM) SE Runtime Environment (build 1.8.0_45-b14) Java Hotspot(TM) 64-Bit Server VM (build 25.45-b02, mixed mode)

如果對了的話，那么下一步就是在/bin/java創建一個快捷方式，讓Hadoop讀到/usr/bin/java里的信息：

$ sudo ln -s /usr/bin/java /bin/java 再輸入命令$ /bin/java -version驗證一遍，顯示： 引用 Java version "1.8.0_45" Java(TM) SE Runtime Environment (build 1.8.0_45-b14) Java Hotspot(TM) 64-Bit Server VM (build 25.45-b02, mixed mode)

這個時候你在執行sudo ln -s /usr/bin/java /bin/java出現問題：ln: /bin/java: Operation not permitted

這是mac系統的原因不是你的錯。
這是因為蘋果在OS X 10.11中引入的SIP特性使得即使加了sudo（也就是具有root權限）也無法修改系統級的目錄，其中就包括了/usr/bin。要解決這個問題有兩種做法：一種是比較不安全的就是關閉SIP，也就是rootless特性；另一種是將本要鏈接到/usr/bin下的改鏈接到/usr/local/bin下就好了。
廢話不多說上解決方法：

重啟按住 Command+R，進入恢復模式，打開Terminal

csrutil disable

重啟即可。如果要恢復默認，最好這么做，那么

csrutil enable

參考鏈接：http://www.jianshu.com/p/22b89f19afd6

---------------------
作者：后打開撒打發了
來源：CSDN
原文：https://blog.csdn.net/chenxun_2010/article/details/78238251
版權聲明：本文為博主原創文章，轉載請附上博文鏈接！

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Mac下hadoop運行word count的坑 Mac OS下搭建Hadoop + Spark集群 Mac下搭建jekyll環境 Mac下Boost環境搭建 mac下搭建appium環境 Mac下Qt的環境搭建 mac 下vue環境搭建過程（包含node.js的安裝以及踩坑）在Vmware中Centos下的Hadoop環境搭建在Eclipse下搭建Hadoop開發環境 Hadoop-2.8.0 開發環境搭建（Mac）