采用的源代碼是2.7.1的,從這個網站下可以找到2.7.1的代碼:https://git1-us-west.apache.org/ ,使用gitclone出來,然后git checkout到2.7.1的分支上:
整個hadoop項目包括了幾十個文件目錄,每一個目錄一般都是一個Maven工程,這些maven工程之間存在依賴關系:
其中,Apache Hadoop Main是所有工程的父工程,它的pom.xml文件如下:
可以看到,pom.xml文件中的packaging標簽為pom類型。
Apache Hadoop Project依賴於Apache Hadoop Main:
Apache Hadoop Project Dist 依賴於Apache Hadoop Project:
通過這種方式可以隨時查看每一個工程之間的依賴關系。
從宏觀上,可以將Apache Hadoop Main項目的目錄結構一層、一層展開,看到項目之間的依賴關系:





