一快速性

如果在內存中運行MapRaduce,要比Hadoop快100倍

如果在磁盤中運行,要比Hadoop快10倍

Spark使用先進的有向無環圖執行引擎來支持非循環的數據流在內存中計算

二易用性

Spark提供超過80個高階算子,這些算子使其很容易構建並行應用

這些算子支持多種語言按照切合度排序為 Scala, Python, R

Spark有一個強大的堆庫,包括SQL and DataFrames, MLlib for machine learning, GraphX, and Spark Streaming

你可以在同一個應用中無縫的組合使用這些庫

Spark可以運行在Hadoop, Mesos, standalone, or in the cloud

他可以訪問不同的數據源包括HDFS, Cassandra, HBase, and S3.

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 spark（1） spark是什么、spark四大特性、spark集群架構數據的四大特性事務的四大特性（ACID） SQL事物四大特性事務的四大特性（一）事務的四大特性事務的四大特性(ACID): java四大特性詳解事務的四大特性 Java的四大基礎特性