一,介紹 ,舊API中有 org.apache.hadoop.mapred.lib.MultipleOutputFormat和org.apache.hadoop.mapred.lib.MultipleOutputs MultipleOutputFormat allowing to write the output data to different output files. MultipleOu ...
2012-05-22 22:08 2 7022 推薦指數:
MultipleOutputs 類可以將數據寫到多個文件,這些文件的名稱源於輸出的鍵和值或者任意字符串。這允許每個 reducer(或者只有 map 作業的 mapper)創建多個文件。 采用name-m-nnnnn 形式的文件名用於 map 輸出,name-r-nnnnn 形式的文件名用於 ...