在Eclipse中開發MapReduce程序


  一、Eclipse的安裝與設置

  1.在Eclipse官網上下載eclipse-jee-oxygen-3a-linux-gtk-x86_64.tar.gz文件並將其拷貝到/home/jun/Resources下,然后再將文件拷貝到/home/jun下並解壓。

[jun@master ~]$ cp /home/jun/Resources/eclipse-jee-oxygen-3a-linux-gtk-x86_64.tar.gz /home/jun/
[jun@master ~]$ tar -zxvf /home/jun/eclipse-jee-oxygen-3a-linux-gtk-x86_64.tar.gz 

  2.執行.eclipse程序即可啟動eclipse

[jun@master ~]$ cd eclipse/
[jun@master eclipse]$ ls
artifacts.xml  configuration  dropins  eclipse  eclipse.ini  features  icon.xpm  p2  plugins  readme
[jun@master eclipse]$ ./eclipse 

  3.安裝hadoop插件

  (1)下載:https://github.com/winghc/hadoop2x-eclipse-plugin/blob/master/release/hadoop-eclipse-plugin-2.6.0.jar

  (2)將hadoop-eclipse-plugin-2.6.0.jar放到/home/jun/eclipse/plugins下

  (3)啟動eclipse,選擇Window→Preferences→Hadoop Map/Reduce→Hadoop installation directory→選擇/home/jun/hadoop

  (4)選擇Window→Show View→Other→MapReduce Tools→Map/Reduce Locations→OK

  (5)在下方Map/Reduce Locations子窗口內空白部分右鍵-New Hadoop Location

  (6)按下圖進行配置,點擊Finish

  

   (7)在左邊看到下面圖即可

  

  

  二、在Eclipse上開發MapReduce程序

  1.新建input.txt並上傳到HDFS的/test文件夾中,在eclipse中右鍵點擊Refresh即可看到剛剛上傳的文件。在eclipse中可以進行文件目錄創建、文件上傳、文件下載、文件或文件夾刪除等操作,但是不能編輯文件內容。

  

  2.新建項目

  選擇File→New→Other→Map/Reduce Project→Next→Project name{WordCount}→Next→Finish

  然后新建包和類

   

  3.獲得源碼

  桌面上進入

  選擇hadoop-mapreduce-examples-2.8.4-sources.jar並右鍵Open With Archive Manager,找到WordCount.java用gedit打開即可得到源碼

  然后將源碼復制到eclipse新建的類中

  4.運行程序  

  在java文件上右鍵點擊Run As→Run Configurations→Java Application→Arguments

  第一個參數是輸入文件,第二個參數是輸出目錄(必須之前不存在),然后點擊Apply

  

  在Java文件上右鍵Run As→Run on Hadoop

  然后在Hadoop的test目錄下新增了output子目錄,且下面有兩個文件,其中part-r-000000包含了計算結果

  

  到這里,就完成了第一個在Eclipse上開發並運行MapReduce程序。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM