大數據學習腦圖以及7個入門教程!


近些年,大數據的火熱可謂是技術人都知道啊,很多人呢,也想學習大數據相關,所以,這里分享幾個大數據腦圖,希望可以讓你清楚明白從哪里入門大數據,知道該學習以及掌握哪些知識點;

大數據相關腦圖:

hadoop生態圈(轉).png

大數據(轉).jpg

HIVE學習路徑(轉).png

大數據工程師 - 學習路徑 - 實驗樓.png

PS.上圖中的所有課程以及項目,皆可在實驗樓在線學習;

當然,除了上面的腦圖呢,這里還分享幾個相關基礎入門教程,旨在幫助你快速入門掌握大數據相關知識點;

實驗樓hadoop課程列表:

Hadoop是一款支持數據密集型分布式應用並以Apache 2.0許可協議發布的開源軟件框架,該教程學習並實踐Hadoop系統的不同模式的部署,以及基本的系統使用與管理。

課程涵蓋了大數據領域常見的組件,如Hadoop,Mapreduce,HBase,Mahout,Pig,Hive,Sqoop等。首先從理論上進行介紹,然后讓您在實驗環境中一步步搭建,及相應的案例學習。學習完本課程您將對大數據有深入的了解,並能夠很快的上手。

對於圖處理,hadoop的mapreduce提供一層合並,這表明我們不得不像剝洋蔥一樣來處理圖數據,Giraph 是 Google Pregel 的一種開源實現。本課程將基於hadoop平台實現Giraph 分布式系統中的圖處理。

Hive 是一個基於 Hadoop 文件系統之上的數據倉庫架構。它可以將結構化的數據文件映射為一張數據庫表,並提供簡單的 sql 查詢功能。還可以將 sql 語句轉換為 MapReduce 任務運行。該教程就帶你快速入門HIVE。

Mahout 是 Apache Software Foundation(ASF) 旗下的一個開源項目,提供一些可擴展的機器學習領域經典算法的實現,旨在幫助開發人員更加方便快捷地創建智能應用程序。本課程難度為簡單,屬於入門級別課程,適合本課程難度為一般,屬於初級級別課程,適合具有hadoop基礎的用戶。

HBase是一個開源的非關系型分布式數據庫(NoSQL),是Hadoop項目的一部分,運行於HDFS文件系統之上,為 Hadoop 提供類似於BigTable 規模的服務。該課程帶你快速入門HBase。

本課程是 Hadoop 的一個非常基礎的應用項目,利用實驗樓提供的 Hadoop 環境,對一本武俠小說的文集進行簡單的 WordCount 詞頻統計,從而得到該書中出現頻次最高的人名。需要一定的 Hadoop 和 MapReduce 基礎。本課程難度為簡單,屬於入門級別課程,適合對 Hadoop 剛剛入門的用戶,甚至沒有接觸過 Hadoop 的用戶也可以按照步驟一步步做出來。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM