大數據框架:現階段用的最多的就hadoop、spark、flinnk。三者都是apache軟件基金會的頂級開源項目。
Hadoop: Apache Hadoop 軟件庫是一個允許在計算機集群上通過分布式運算使用簡單編程模式處理大型的數據集合
Spark: Apache Spark 是一個為海量數據處理的統一分析引擎。
Flink: Apache Flinnk 是一個分布式,高效且使終可用的開源流處理框架和精確的數據流應用程序。
大數據技術框架見附件:
數據處理:
參考:
http://hadoop.apache.org
http://spark.apache.org
http://flink.apache.org
鏈接: