一快速性

如果在内存中运行MapRaduce,要比Hadoop快100倍

如果在磁盘中运行,要比Hadoop快10倍

Spark使用先进的有向无环图执行引擎来支持非循环的数据流在内存中计算

二易用性

Spark提供超过80个高阶算子,这些算子使其很容易构建并行应用

这些算子支持多种语言按照切合度排序为 Scala, Python, R

Spark有一个强大的堆库,包括SQL and DataFrames, MLlib for machine learning, GraphX, and Spark Streaming

你可以在同一个应用中无缝的组合使用这些库

Spark可以运行在Hadoop, Mesos, standalone, or in the cloud

他可以访问不同的数据源包括HDFS, Cassandra, HBase, and S3.

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 spark（1） spark是什么、spark四大特性、spark集群架构事务的四大特性事务的四大特性(ACID): java四大特性详解事务的四大特性 Java的四大基础特性数据库四大特性 Java基础之java的四大特性举例讲述事务的四大特性事务的四大特性？分别含义？