HDP:
(1) 介紹:
HDP全稱叫做Hortonworks Data Platform。
Hortonworks數據平台是一款基於Apache Hadoop的是開源數據平台,提供大數據雲存儲,大數據處理和分析等服務。該平台是專門用來應對多來源和多格式的數據,並使其處理起來能變成簡單、更有成本效益。HDP還提供了一個開放,穩定和高度可擴展的平台,使得更容易地集成Apache Hadoop的數據流業務與現有的數據架構。該平台包括各種的Apache Hadoop項目以及Hadoop分布式文件系統(HDFS)、MapReduce、Pig、Hive、HBase、Zookeeper和其他各種組件,使Hadoop的平台更易於管理,更加具有開放性以及可擴展性。
官網地址為:http://zh.hortonworks.com/
(2) 平台架構:
CDH:
(1)介紹:
Cloudera版本(Cloudera Distribution Hadoop,簡稱“CDH”),還有其他的版本,目前中國公司我發現用的CDH版本較多。
https://www.cloudera.com/documentation.html
(2)平台架構:
HDP與CDH對比:
tips:
- CDH支持的存儲組件更豐富
- HDP支持的數據分析組件更豐富
- HDP對多維分析及可視化有了支持,引入Druid和Superset
- HDP的HBase數據使用Phoenix的jdbc查詢;CDH的HBase數據使用映射Hive到Impala的jdbc查詢,但分析數據可以存儲Impala內部表,提高查詢響應
- 多維分析Druid納入集群,會方便管理;但可視化工具Superset可以單獨安裝使用
- CDH沒有時序數據庫,HDP將Druid作為時序數據庫使用