拿到一份Hadoop源碼之后,經常關注的兩件事情就是
1、怎么閱讀?涉及IDEA和Eclipse工程搭建。IDEA搭建,選擇源碼,逐步導入即可;Eclipse可以選擇后台生成工程,也可以選擇IDE導入。二者工程也可以互相導入\到處。
2、怎么構建?利用maven,生成安裝包。
二者均需配置maven,相關工具配置參考另兩篇帖子《Hadoop源碼編譯環境搭建》和《IDEA配置maven中央庫》
1、下載源碼
http://mirror.bit.edu.cn/apache/hadoop/common/

2、導入IDEA工程
新建工程:
File-->New-->Project from Existing Sources

選擇源碼目錄:

選擇maven:

選擇"Search for projects recursively",並設置maven環境變量。

依次選擇所需工程:

開始scanning工程:

掃描完成之后:

3、查閱源碼
經常看到各種大神總結帖子講述HDFS、MapReduce和yarn等相關原理、配置參數,版本各一。
而真正的原理和機制關鍵在於架構設計和代碼實現。官方文檔和源碼實現才是學習正途,前人的總結與分享應該作為一種借鑒和捷徑;奇正犄角,學習一種新東西。
一個Hadoop源碼閱讀工程就創建好了。比如打開FsShell類:

