Hadoop_05_運行 Hadoop 自帶 MapReduce程序

本文轉載自查看原文 2018-06-16 08:59 1597 9.1.Hadoop

1. MapReduce使用

　　MapReduce是Hadoop中的分布式運算編程框架，只要按照其編程規范，只需要編寫少量的業務邏輯代碼即可實現

一個強大的海量數據並發處理程序

2. 運行Hadoop自帶的MapReduce程序（word count單詞統計功能）

　　1.在HDFS中創建層級目錄，並且上傳文件到指定目錄：hadoop fs -mkdir -p /wordcount/input

　　2.上傳文件到HDFS指定目錄：hadoop fs -put a.txt b.txt /wordcount/input

　　3.運行MapReduce程序的自帶jar包：cd /usr/local/src/hadoop-2.6.4/share/hadoop/mapreduce/

　　運行：hadoop jar hadoop-mapreduce-examples-2.6.4.jar wordcount /wordcount/input /wordcount/output

　　　　wordcount：jar包中需要運行的主類

　　　　/wordcount/input：wordcount主類需要的參數，指定數據文件目錄，統計里面的數據文件

　　　　/wordcount/output：統計文件后的結果保存目錄，必須要求改目錄不存在

　　4.查看輸出文件統計結果：hadoop fs -cat /wordcount/output/part-r-00000

自己寫MapReduce程序可參考這篇用MapReduce計算Pi的文章http://blog.csdn.net/mrbcy/article/details/61455917

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Hadoop學習歷程（四、運行一個真正的MapReduce程序）在命令行中運行Hadoop自帶的WordCount程序 Hadoop（十三）分析MapReduce程序 Hadoop（十五）MapReduce程序實例 Python實現Hadoop MapReduce程序使用命令行編譯打包運行自己的MapReduce程序 Hadoop2.6.0 簡單的java Hadoop MapReduce程序(計算平均成績)從打包到提交及運行 hadoop MapReduce Yarn運行機制 Java開發的mapreduce如何在hadoop中運行 hadoop 把mapreduce任務從本地提交到hadoop集群上運行