Grep案例
第一步: 在Hadoop文件夾下
mkdir input
cp etc/hadoop/*.xml input/
hadoop jar share/hadoop/mapreduce//hadoop-mapreduce-examples-2.7.2.jar grep input/ output 'dfs[a-z.]+'
執行完上一句會創建一個output文件夾(里邊有兩個文件)這個文件夾不能自己創建
輸入 cat part-r-00000
輸出結果為符合'dfs[a-z.]+'條件的數據
wordCount案例
mkdir wcinput
cd wcinput
touch wc.input(名字隨便起)
vim wc.input
輸入一些數據
tianyi huichao lihua
zhangcheng xiaoheng
xinbo xinbo
gaoyang gaoyang gaoyang yanjing yanjing
保存退出
cd .. 退回上一層
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput/ wcoutput
cd wcoutput
cat part-r-00000
統計出每個單詞出現的次數