Hadoop學習筆記(二):從map到reduce的數據流
一個MapReduce作業是一個用戶希望被執行的工作單元:它包括輸入數據,MapReduce程序和配置信息。Hadoop通過把作業分成任務(tasks,分為map tasks 和reduce tasks兩種)的形式來運行該作業。 有兩種節點用來控制每個作業的執行: jobtracker ...
一個MapReduce作業是一個用戶希望被執行的工作單元:它包括輸入數據,MapReduce程序和配置信息。Hadoop通過把作業分成任務(tasks,分為map tasks 和reduce tasks兩種)的形式來運行該作業。 有兩種節點用來控制每個作業的執行: jobtracker ...