(一)Spark 特點


Spark的特性主要有以下四點:

快速

  • 與 Hadoop 的 MapReduce 相比, Spark 基於內存的運算是 MapReduce 的 100 倍.基於硬盤的運算也要快 10 倍以上.
  • Spark 實現了高效的 DAG 執行引擎, 可以通過基於內存來高效處理數據流

易用

  • Spark 支持 Scala, Java, Python, R 和 SQL 腳本, 並提供了超過 80 種高性能的算法, 非常容易創建並行 App
  • 而且 Spark 支持交互式的 Python 和 Scala 的 shell, 這意味着可以非常方便地在這些 shell 中使用 Spark 集群來驗證解決問題的方法, 而不是像以前一樣 需要打包, 上傳集群, 驗證等. 這對於原型開發非常重要.

通用

  • Spark 結合了SQL, Streaming和復雜分析.
  • Spark 提供了大量的類庫, 包括 SQL 和 DataFrames, 機器學習(MLlib), 圖計算(GraphicX), 實時流處理(Spark Streaming) .
  • 可以把這些類庫無縫的柔和在一個 App 中.
  • 減少了開發和維護的人力成本以及部署平台的物力成本.

易融合性

  • Spark 可以非常方便的與其他開源產品進行融合,比如, Spark 可以使用 Hadoop 的 YARN 和 Appache Mesos 作為它的資源管理和調度器, 並且可以處理所有 Hadoop 支持的數據, 包括 HDFS, HBase等.


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM