一、 Hadoop版本
目前Hadoop發行版本非常多,我個人接觸的有HDP和CDH,Hortonworks版本(Hortonworks Data Platform,簡稱“HDP”),Cloudera版本(Cloudera Distribution Hadoop,簡稱“CDH”),還有其他的版本,目前中國公司我發現用的CDH版本較多,至於什么原因我也不是很清楚,不知道是不是跟風,從我個人的角度使用來看,我覺得HDP版本要比CDH要好。
二、 HDP與CDH對比
1. 據個人了解HDP是100%完全開源的,而CDH還不是100%完全開源。Hortonworks的工程師是社區的主要貢獻者,Cloudera的發行版本也是比較清晰的。
2. HDP使用開源工具Ambari安裝,CDH使用Cloudera Manager工具安裝。對配置的修改與更新我喜歡Ambari的界面,可以很方便的修改集群配置,Cloudera Manager的配置界面真的是太爛了,不方便,發現有些配置竟然沒法改。
3. 支持的組件,HDP基本上支持所有的開源大數據組件,CDH也基本上支持所有的開源大數據組件。
4. 代碼包依賴,如果是HDP平台,編寫代碼直接依賴hadoop版本即可,如果是CDH平台,編寫代碼要依賴cdh的版本,否則運行不成功,這是坑啊。
博客:https://blog.csdn.net/jsutyq/article/details/80762965