1 词频统计
a.下载喜欢的电子书或大量文本数据,并保存在本地文本文件中
b.编写map与reduce函数
mapper.py
reducer.py
c.本地测试map与reduce
d.将文本数据上传至HDFS上
e.用hadoop streaming提交任务
f.查看运行结果
g.计算结果取回到本地
2.气象数据分析
a.批量下载气象数据
b.编写map与reduce函数
TempMapper.py
TempReducer.py
(行9末缺失一个冒号,补充后便能正常运行)
c.将气象数据上传至HDFS上
d.用hadoop streaming提交任务
e.查看运行结果
f.计算结果取回到本地