eclipse遠程調試Hadoop

本文轉載自查看原文 2016-05-15 16:22 10842 Hadoop技術

　　環境需求：　　系統：window 10　　eclipse版本：Mars　　Hadoop版本：2.6.0

　　資源需求：解壓后的Hadoop-2.6.0，原壓縮包自行下載：下載地址

　　丑話前頭說：

　　以下的操作中，eclipse的啟動均需要右鍵“管理員運行”！

　　在創建MapReduce的Project那塊需要配置log4j（級別是debug），否則打印不出一些調試的信息，從而不好找出錯的原因。配置這個log4j很簡單，大家可以在網上搜索一下，應該可以找得到相關的配置。

　　1）首先需要利用ant編譯自己的Hadoop-eclipse-plugin插件，你也可以自己網上搜索下載，我不喜歡用別人的東西，所以自己編譯了一把，你們也可以參考我的另一篇博文，學着自己編譯——《利用Apache Ant編譯Hadoop2.6.0-eclipse-plugin》

　　2）把編譯好的Hadoop插件放到eclipse目錄下的plugins下，然后重啟eclipse

　　3）打開window-->Preferences-->Hadoop Map/Reduce設置里面的Hadoop安裝目錄

　　4）打開window-->Show View找到MapReduce Tools下的Map/Reduce Location，確定

　　5）然后在eclipse的主界面就可以看到Map/Reduce Location的對話框了

　　6）新建一個Hadoop Location，修改HDFS和yarn的主節點和端口，finish。

　　7）這時，在eclipse的Project Explorer中會看到HDFS的目錄結構——DFS Locations

　　注意：可能你打開這個目錄結構的時候回存在權限問題（Premission），這是因為你在Hadoop的HDFS的配置文件hdfs-site.xml中沒有配置權限（默認是true，意思是不能被集群外的節點訪問HDFS文件目錄），我們需要在這兒配置為false，重啟hdfs服務，然后刷新上述dfs目錄即可：

    <property>
        <name>dfs.permissions.enabled</name>
        <value>false</value>
    </property>

　　8）然后我們創建一個Map/Reduce Project，創建一個wordcount程序，我把Hadoop的README.txt傳到/tmp/mrchor/目錄下並改名為readme，輸出路徑為/tmp/mrchor/out。

package com.mrchor.HadoopDev.hadoopDev;

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WordCountApp {

    public static void main(String[] args) throws Exception {
        Configuration conf = new Configuration();
        Job job = Job.getInstance(conf, WordCountApp.class.getSimpleName());
        job.setJarByClass(com.mrchor.HadoopDev.hadoopDev.WordCountApp.class);
        // TODO: specify a mapper
        job.setMapperClass(MyMapper.class);
        // TODO: specify a reducer
        job.setReducerClass(MyReducer.class);

        // TODO: specify output types
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(LongWritable.class);

        // TODO: specify input and output DIRECTORIES (not files)
        FileInputFormat.setInputPaths(job, new Path("hdfs://master:8020/tmp/mrchor/readme"));
        FileOutputFormat.setOutputPath(job, new Path("hdfs://master:8020/tmp/mrchor/out"));

        if (!job.waitForCompletion(true))
            return;
    }

    public static class MyMapper extends Mapper<LongWritable, Text, Text, LongWritable>{
        Text k2 = new Text();
        LongWritable v2 = new LongWritable();
        @Override
        protected void map(LongWritable key, Text value, Mapper<LongWritable, Text, Text, LongWritable>.Context context)
                throws IOException, InterruptedException {
            String[] split = value.toString().split(" ");
            for (String word : split) {
                k2.set(word);
                v2.set(1);
                context.write(k2, v2);
            }
        }
    }
    
    public  static class MyReducer extends Reducer<Text, LongWritable, Text, LongWritable>{
        long sum = 0;
        @Override
        protected void reduce(Text k2, Iterable<LongWritable> v2s,
                Reducer<Text, LongWritable, Text, LongWritable>.Context context) throws IOException, InterruptedException {
            for (LongWritable one : v2s) {
                sum+=one.get();
            }
            context.write(k2, new LongWritable(sum));
        }
    }
    
}

　　9）右鍵Run As-->Run on Hadoop:

　　　A）注意：這邊可能報錯:

 java.io.IOException: HADOOP_HOME or hadoop.home.dir are not set.

　　　　這是因為你在安裝eclipse的這台機子上沒有配置Hadoop的環境變量，需要配置一下：

　　　　一）右鍵“我的電腦”或者“此電腦”選擇屬性：進入到高級系統設置-->高級-->環境變量配置-->系統變量

　　　　　　新建一個HADOOP_HOME，配置解壓后的Hadoop-2.6.0的目錄

　　　　二）重啟eclipse（管理員運行）

　　10）繼續運行wordcount程序，Run on Hadoop，可能會報如下錯：

Exception in thread "main" java.lang.UnsatisfiedLinkError: org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Ljava/lang/String;I)Z
    at org.apache.hadoop.io.nativeio.NativeIO$Windows.access0(Native Method)
    at org.apache.hadoop.io.nativeio.NativeIO$Windows.access(NativeIO.java:557)
    at org.apache.hadoop.fs.FileUtil.canRead(FileUtil.java:977)
    at org.apache.hadoop.util.DiskChecker.checkAccessByFileMethods(DiskChecker.java:187)
    at org.apache.hadoop.util.DiskChecker.checkDirAccess(DiskChecker.java:174)
    at org.apache.hadoop.util.DiskChecker.checkDir(DiskChecker.java:108)
    at org.apache.hadoop.fs.LocalDirAllocator$AllocatorPerContext.confChanged(LocalDirAllocator.java:285)
    at org.apache.hadoop.fs.LocalDirAllocator$AllocatorPerContext.getLocalPathForWrite(LocalDirAllocator.java:344)
    at org.apache.hadoop.fs.LocalDirAllocator.getLocalPathForWrite(LocalDirAllocator.java:150)
    at org.apache.hadoop.fs.LocalDirAllocator.getLocalPathForWrite(LocalDirAllocator.java:131)
    at org.apache.hadoop.fs.LocalDirAllocator.getLocalPathForWrite(LocalDirAllocator.java:115)
    at org.apache.hadoop.mapred.LocalDistributedCacheManager.setup(LocalDistributedCacheManager.java:131)
    at org.apache.hadoop.mapred.LocalJobRunner$Job.<init>(LocalJobRunner.java:163)
    at org.apache.hadoop.mapred.LocalJobRunner.submitJob(LocalJobRunner.java:731)
    at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:536)
    at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1296)
    at org.apache.hadoop.mapreduce.Job$10.run(Job.java:1293)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1628)
    at org.apache.hadoop.mapreduce.Job.submit(Job.java:1293)
    at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:1314)
    at com.mrchor.HadoopDev.hadoopDev.WordCountApp.main(WordCountApp.java:34)

　　通過源碼查看，發現在NativeIO.java有說明——還是權限問題，可能是需要將當前電腦加入到HDFS授權的用戶組：

    /**
     * Checks whether the current process has desired access rights on
     * the given path.
     * 
     * Longer term this native function can be substituted with JDK7
     * function Files#isReadable, isWritable, isExecutable.
     *
     * @param path input path
     * @param desiredAccess ACCESS_READ, ACCESS_WRITE or ACCESS_EXECUTE
     * @return true if access is allowed
     * @throws IOException I/O exception on error
     */

　　但是，我們這邊有一個更加巧妙的辦法解決這個問題——將源碼中的這個文件復制到你的MapReduce的Project中，這個意思是程序在執行的時候回優先找你Project下的class作為程序的引用，而不會去引入的外部jar包中找：

　　11）繼續運行wordcount程序，這次應該程序可以執行了，結果為：

　　如果得到上面這個結果，說明程序運行正確，打印出來的是MapReduce程序運行結果。我們再刷新目錄，可以看到/tmp/mrchor/out目錄下有兩個文件——_SUCCESS和part-r-00000：

　　說明程序運行結果正確，此時，我們的eclipse遠程調試Hadoop宣告成功！！！大家鼓掌O(∩_∩)O

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 [轉]Eclipse中遠程調試Hadoop eclipse/intellij idea 遠程調試hadoop 2.6.0 Eclipse遠程連接Hadoop 遠程調試Hadoop（轉） eclipse遠程調試 eclipse遠程調試tomcat Hadoop實現遠程登錄與調試使用eclipse遠程調試weblogic 使用Eclipse進行遠程調試 Eclipse-與Centos遠程調試