原文:MultipleOutputFormat和MultipleOutputs

一,介紹 ,舊API中有 org.apache.hadoop.mapred.lib.MultipleOutputFormat和org.apache.hadoop.mapred.lib.MultipleOutputs MultipleOutputFormat allowing to write the output data to different output files. MultipleOu ...

2012-05-22 22:08 2 7022 推薦指數:

查看詳情

通過MultipleOutputs寫到多個文件

MultipleOutputs 類可以將數據寫到多個文件,這些文件的名稱源於輸出的鍵和值或者任意字符串。這允許每個 reducer(或者只有 map 作業的 mapper)創建多個文件。 采用name-m-nnnnn 形式的文件名用於 map 輸出,name-r-nnnnn 形式的文件名用於 ...

Tue May 03 03:46:00 CST 2016 1 4253
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM