最近因為做了些和hadoop相關的項目(雖然主要是運維),但是這段經歷讓我對hadoop的實際運用有了更加深入的理解。
相比以前自學hadoop,因為沒有實戰場景以及良好的大數據學習氛圍,現在回顧下的確相當膚淺。
因此我要好好重學下hadoop,短期計划如下:
1.重學HDFS知識
2.重學mapreduce,包括老版的mr以及新的yarn
3.學習hive和pig
4.學習hbase
5.以上學習都是通過理解其架構原理為目的,最后結合大型網站架構里存儲的問題,進一步完善關於解決存儲瓶頸的知識。
最近的學習讓我發現hadoop技術是一個完美的分布式系統的學習案例,它的設計思想也是大型網站架構的核心思想之一。
希望等出差回去武漢一個月左右時間完成這個新的學習計划,給自己鼓個勁,加油!!!