1 词频统计
a.下载喜欢的电子书或大量文本数据,并保存在本地文本文件中

b.编写map与reduce函数
mapper.py

reducer.py

c.本地测试map与reduce

d.将文本数据上传至HDFS上


e.用hadoop streaming提交任务


f.查看运行结果

g.计算结果取回到本地

2.气象数据分析
a.批量下载气象数据

b.编写map与reduce函数
TempMapper.py

TempReducer.py
(行9末缺失一个冒号,补充后便能正常运行)

c.将气象数据上传至HDFS上


d.用hadoop streaming提交任务


e.查看运行结果

f.计算结果取回到本地

