hadoop本地运行官方Grep案例 wordCount案例

本文转载自查看原文 2019-12-11 09:52 379

Grep案例

第一步: 在Hadoop文件夹下

mkdir input

cp etc/hadoop/*.xml input/

hadoop jar share/hadoop/mapreduce//hadoop-mapreduce-examples-2.7.2.jar grep input/ output 'dfs[a-z.]+'

执行完上一句会创建一个output文件夹(里边有两个文件)这个文件夹不能自己创建

输入 cat part-r-00000

输出结果为符合'dfs[a-z.]+'条件的数据

wordCount案例

　　　mkdir wcinput

cd wcinput

　　　touch wc.input(名字随便起)

　　　vim wc.input

　　　　输入一些数据

tianyi huichao lihua
zhangcheng xiaoheng
xinbo xinbo
gaoyang gaoyang gaoyang yanjing yanjing

保存退出

　　　　cd .. 退回上一层

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput/ wcoutput

cd wcoutput

cat part-r-00000

统计出每个单词出现的次数

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 hadoop 2.7.3本地环境运行官方wordcount Hadoop案例（十）WordCount hadoop 2.7.3本地环境运行官方wordcount-基于HDFS 在Hadoop系统中运行WordCount案例失败解决方法 hadoop运行案例 Hadoop学习笔记：运行wordcount对文件字符串进行统计案例 hadoop 2.7.3伪分布式环境运行官方wordcount hadoop本地运行wordcount报错解决，并成功运行 idea连接本地虚拟机Hadoop集群运行wordcount hadoop的wordcount例子运行