大數據平台:HDP,CDH


HDP:

(1) 介紹:

HDP全稱叫做Hortonworks Data Platform。

  Hortonworks數據平台是一款基於Apache Hadoop的是開源數據平台,提供大數據雲存儲,大數據處理和分析等服務。該平台是專門用來應對多來源和多格式的數據,並使其處理起來能變成簡單、更有成本效益。HDP還提供了一個開放,穩定和高度可擴展的平台,使得更容易地集成Apache Hadoop的數據流業務與現有的數據架構。該平台包括各種的Apache Hadoop項目以及Hadoop分布式文件系統(HDFS)、MapReduce、Pig、Hive、HBase、Zookeeper和其他各種組件,使Hadoop的平台更易於管理,更加具有開放性以及可擴展性。

  官網地址為:http://zh.hortonworks.com/

(2) 平台架構:

 

 

 

 

CDH:

(1)介紹: 

Cloudera版本(Cloudera Distribution Hadoop,簡稱“CDH”),還有其他的版本,目前中國公司我發現用的CDH版本較多。

https://www.cloudera.com/documentation.html

(2)平台架構:

 

 

HDP與CDH對比:

 

 

 

 

tips:

  1. CDH支持的存儲組件更豐富
  2. HDP支持的數據分析組件更豐富
  3. HDP對多維分析及可視化有了支持,引入Druid和Superset
  4. HDP的HBase數據使用Phoenix的jdbc查詢;CDH的HBase數據使用映射Hive到Impala的jdbc查詢,但分析數據可以存儲Impala內部表,提高查詢響應
  5. 多維分析Druid納入集群,會方便管理;但可視化工具Superset可以單獨安裝使用
  6. CDH沒有時序數據庫,HDP將Druid作為時序數據庫使用

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM