花費 55 ms
Spark學習之路 (一)Spark初識

一、官網介紹 1、什么是Spark 官網地址:http://spark.apache.org/ Apache Spark™是用於大規模數據處理的統一分析引擎。 從右側最后一條新聞看,Spa ...

Fri Apr 20 05:24:00 CST 2018 3 157741
Spark學習之路 (三)Spark之RDD

一、RDD的概述 1.1 什么是RDD? RDD(Resilient Distributed Dataset)叫做彈性分布式數據集,是Spark中最基本的數據抽象,它代表一個不可變、可分區、里面的 ...

Sat Apr 21 19:28:00 CST 2018 11 97621
Spark中文指南(入門篇)-Spark編程模型(一)

前言 本章將對Spark做一個簡單的介紹,更多教程請參考: Spark教程 ##本章知識點概括 - Apache Spark簡介 - Spark的四種運行模式 - Spark基於St ...

Tue Jun 28 02:59:00 CST 2016 3 98733
大數據學習之路(持續更新中...)

在16年8月份至今,一直在努力學習大數據大數據相關的技術,很想了解眾多老司機的學習歷程。因為大數據涉及的技術很廣需要了解的東西也很多,會讓很多新手望而卻步。所以,我就在自己學習的過程中總結一下學 ...

Mon Dec 19 04:22:00 CST 2016 31 74702
Spark入門——什么是Hadoop,為什么是Spark?

  #Spark入門#這個系列課程,是綜合於我從2017年3月分到今年7月份為止學習並使用Spark的使用心得感悟,暫定於每周更新,以后可能會上傳講課視頻和PPT,目前先在博客園把稿子打好。注意:這只 ...

Thu Jul 19 23:08:00 CST 2018 11 42422
HDFS常用命令

1. 文件操作 (1) 列出HDFS下的文件 (2) 列出HDFS文件下名為in的文檔中的文件 (3) 上傳文件 將hadoop目錄下的test1文件上傳到HDFS ...

Thu Mar 05 04:27:00 CST 2015 0 109438
Spark函數詳解系列之RDD基本轉換

摘要: RDD:彈性分布式數據集,是一種特殊集合 ‚ 支持多種來源 ‚ 有容錯機制 ‚ 可以被緩存 ‚ 支持並行操作,一個RDD代表一個分區里的數據集 RDD有兩種操作算子 ...

Sun Apr 10 09:51:00 CST 2016 3 73179
Spark(一): 基本架構及原理

Apache Spark是一個圍繞速度、易用性和復雜分析構建的大數據處理框架,最初在2009年由加州大學伯克利分校的AMPLab開發,並於2010年成為Apache的開源項目之一,與Had ...

Wed Aug 31 05:51:00 CST 2016 4 52932

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM