原文:MultipleOutputFormat和MultipleOutputs

一,介绍 ,旧API中有 org.apache.hadoop.mapred.lib.MultipleOutputFormat和org.apache.hadoop.mapred.lib.MultipleOutputs MultipleOutputFormat allowing to write the output data to different output files. MultipleOu ...

2012-05-22 22:08 2 7022 推荐指数:

查看详情

通过MultipleOutputs写到多个文件

MultipleOutputs 类可以将数据写到多个文件,这些文件的名称源于输出的键和值或者任意字符串。这允许每个 reducer(或者只有 map 作业的 mapper)创建多个文件。 采用name-m-nnnnn 形式的文件名用于 map 输出,name-r-nnnnn 形式的文件名用于 ...

Tue May 03 03:46:00 CST 2016 1 4253
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM