2.1概述
2.1.1Hadoop簡介
- Hadoop是Apache軟件基金會旗下的一個開源分布式計算平台,為用戶提供了系統底層細節透明的分布式基礎架構
- Hadoop是基於Java語言開發的,具有很好的跨平台特性,並且可以部署在廉價的計算機集群中
- Hadoop的核心是分布式文件系統HDFS(Hadoop Distributed File System)和MapReduce
- Hadoop被公認為行業大數據標准開源軟件,在分布式環境下提供了海量數據的處理能力
- 幾乎所有主流廠商都圍繞Hadoop提供開發工具、開源軟件、商業化工具和技術服務,如谷歌、雅虎、微軟、思科、淘寶等,都支持Hadoop
2.1.2Hadoop發展簡史


2.1.3Hadoop的特性

2.1.4Hadoop的應用現狀






2.2Hadoop項目結構


2.3Hadoop的安裝與使用
2.3.1Hadoop安裝之前的預備知識
安裝參考: http://dblab.xmu.edu.cn/blog/285/



2.3.2安裝Linux虛擬機



2.3.3安裝雙操作系統

2.3.4Hadoop的安裝與使用
參考:http://dblab.xmu.edu.cn/blog/install-hadoop/

-
創建hadoop用戶

-
SSH登陸權限設置

-
安裝Java環境

-
單機安裝配置


-
偽分布式安裝配置





2.4Hadoop集群的部署與使用
2.4.1集群節點類型

2.4.2集群硬件配置

2.4.3集群規模

2.4.4集群網絡拓撲

2.4.5集群的建立與安裝

2.4.6集群基准測試

2.4.7在雲計算環境中使用Hadoop


