Spark入門到精通--（第一節）Spark的前世今生

本文轉載自查看原文 2016-08-05 22:01 2271 spark/ Spark、大數據

　　最近由於公司慢慢往spark方面開始轉型，本人也開始學習，今后陸續會更新一些spark學習的新的體會，希望能夠和大家一起分享和進步。

Spark是什么？

　　Apache Spark™ is a fast and general engine for large-scale data processing.（官方說法）

　　Spark，簡單的說是一種通用的大數據計算框架。

　　包含了常見領域的各種框架：核心組件-Spark Core、交互式查詢-Spark SQL、准實時流式計算-Spark Streaming、機器學習-Spark MLlib、圖計算-Spark GraphX。

Spark與Hadoop的關系

　　很多人說Spark可以替換Hadoop，這顯然是錯的。Spark是基於Hadoop的，即Spark主要用於大數據的計算，而Hadoop由於計算方面采用MapReduce的方式，多次反復讀寫磁盤，使得速度遠遠不如Spark快，所以Hadoop以后會用於大數據的存儲（HDFS、Hive、HBase等）和資源調度（Yarn）。

　　Spark本身不具備存儲功能，未來Spark+Hadoop的組合是一套完整的解決方案。

　　Spark可以替換MapReduce的計算框架、Spark SQL可以替換Hive的查詢框架，但並沒有Hive作為數據倉庫的功能，所以只是部分替換。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Scala入門到精通——第一節 Scala語言初步 OpenCV+Python入門詳細教程（第一節）第一節簡單的jsp實例第一節，TensorFlow基本用法第一節 Lync及UCMA介紹【第一節】QtDesigner安裝第一節：Spring 與 SpringMVC 整合 Vue快速學習_第一節第一節：走進MVC的世界第一節 PyQt5簡介