雲技術新興的概念太多,讓我們無法使用,這里說一下什么是CDH
CDH版本衍化
hadoop是一個開源項目,所以很多公司在這個基礎進行商業化,Cloudera對hadoop做了相應的改變。Cloudera公司的發行版,我們將該版本成為CDH(Cloudera Distribution Hadoop)。截止目前為止,CDH共有5個版本,其中,前兩個已經不再更新,最近的兩個,分別是CDH4和Apache Hadoop2.0.0版本基礎上演化而來的。CDH5,他們每隔一段時間便會更新一次。
Cloudera以patch lever划分小版本,比如patch lever為923.142表示在原生態Apache Hadoop0.20.2基礎上添加了1065個patch(這些patch是各個公司或者個人貢獻的,在Hadoop jira上均有記錄),其中923個是最后一個beta版本添加的patch,而142個是穩定版發行后新增加的patch。由此可見,patch lever越高,功能越完備且解決的bug越多。
Cloudera版本層次更加清晰,且它提供了適用於各種操作系統的Hadoop安裝包,可直接使用apt-get或者yum安裝,更加省事。
CDH版本下載
(1)版本含義介紹:
https://ccp.cloudera.com/display/DOC/CDH+Version+and+Packaging+Information
(2)各版本特性查看:
https://ccp.cloudera.com/display/DOC/CDH+Packaging+Information+for+Previous+Releases
(3)各版本下載:
CDH3:http://archive.cloudera.com/cdh/3/
CDH4:http://archive.cloudera.com/cdh/4/
CDH5:http://archive.cloudera.com/cdh/5/
注意,Hadoop壓縮包在這兩個鏈接中的最上層目錄中,不在某個文件夾里,很多人進到鏈接還找不到安裝包!
問:CDH5.3.x使用的是HADOOP的哪個版本?
答:對應hadoop2.5
問:5.3.X能和哪個版本的HBASE/HIVE整合?
答:hive-0.13.1
hbase0.98.6