hadoop是一個能夠對大量數據進行分布式處理的軟件框架,並且是一種可靠,高效,可伸縮的方式進行處理的,它有一下幾方面特性:
1.高可靠性:采用冗余數據存貯方式,即使一個副本發生故障,其他副本也可以保證對外工作的正常進行。
2.高效性:作為並行分布式計算平台,hadoop采用分布式存貯和分布式處理兩大核心技術,能夠高效的處理PB級別的數據
3.高可擴展性:hadoop的設計目標是可以高效穩定的運行在廉價的計算機集群上,可以擴展到數以千計的計算機節點上。
4.高容錯性:采用冗余數據存貯方式,自動保存數據的多個副本,並且能夠自動將失敗的任務重新分配。
5.成本低:hadoop采用廉價的計算機集群,普通的用戶也可以pc機搭建環境
6.運行在linux平台上,hadoop是基於java語言開發的,可以較好的運行在linux的平台上
7.支持多種編程語言,如:C++等/