現在hadoop的版本比較亂,常常搞不清楚版本之間的關系,下面簡單的摘要了,apache hadoop和cloudera hadoop 的版本的演化.
apache hadoop官方給出的版本說明是:
1.0.X - current stable version, 1.0 release
1.1.X - current beta version, 1.1 release
2.X.X - current alpha version
0.23.X - simmilar to 2.X.X but missing NN HA.
0.22.X - does not include security
0.20.203.X - old legacy stable version
0.20.X - old legacy version
下圖來自http://blog.cloudera.com/blog/2012/01/an-update-on-apache-hadoop-1-0/
可以簡單說明apache hadoop和cloudera hadoop版本之間的變化關系
0.20.x版本最后演化成了現在的1.0.x版本
0.23.x版本最后演化成了現在的2.x版本
hadoop 1.0 指的是1.x(0.20.x),0.21,0.22
hadoop 2.0 指的是2.x,0.23.x
CDH3,CDH4分別對應了hadoop1.0 hadoop2.0
董的博客有2篇文章也很清晰的解釋了,hadoop版本以及各自的版本特性:
http://dongxicheng.org/mapreduce-nextgen/how-to-select-hadoop-versions/
http://dongxicheng.org/mapreduce-nextgen/hadoop-2-0-terms-explained/
最后給出常見的下載hadoop不同版本的地址:
http://archive.apache.org/dist/hadoop/core/
http://archive.cloudera.com/cdh/3/
http://archive.cloudera.com/cdh4/cdh/4/
另外附注一個 hadoop各商業發行版的比較: