hadoop本地運行官方Grep案例 wordCount案例

本文轉載自查看原文 2019-12-11 09:52 379

Grep案例

第一步: 在Hadoop文件夾下

mkdir input

cp etc/hadoop/*.xml input/

hadoop jar share/hadoop/mapreduce//hadoop-mapreduce-examples-2.7.2.jar grep input/ output 'dfs[a-z.]+'

執行完上一句會創建一個output文件夾(里邊有兩個文件)這個文件夾不能自己創建

輸入 cat part-r-00000

輸出結果為符合'dfs[a-z.]+'條件的數據

wordCount案例

　　　mkdir wcinput

cd wcinput

　　　touch wc.input(名字隨便起)

　　　vim wc.input

　　　　輸入一些數據

tianyi huichao lihua
zhangcheng xiaoheng
xinbo xinbo
gaoyang gaoyang gaoyang yanjing yanjing

保存退出

　　　　cd .. 退回上一層

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput/ wcoutput

cd wcoutput

cat part-r-00000

統計出每個單詞出現的次數

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 hadoop 2.7.3本地環境運行官方wordcount Hadoop案例（十）WordCount hadoop 2.7.3本地環境運行官方wordcount-基於HDFS 在Hadoop系統中運行WordCount案例失敗解決方法 hadoop運行案例 Hadoop學習筆記：運行wordcount對文件字符串進行統計案例 hadoop 2.7.3偽分布式環境運行官方wordcount hadoop本地運行wordcount報錯解決，並成功運行 idea連接本地虛擬機Hadoop集群運行wordcount hadoop的wordcount例子運行