原文:Spark 2.2.0 文檔中文版 Spark Programming Guide 編程指南

綜述: 在高層中,每個spark應用由一個運行用戶主函數的driver program和執行各種集群上的parallel operations所組成。spark最主要的概念:RDD彈性分布式數據集,它是一個跨越 可並行操作集群 所有節點的基本分區的集合。RDDs可被多種方式創建:hadoop文件系統 或者其他hadoop支持的文件系統 ,或者現有的在主程序上的scala集合。用戶也要求spark ...

2017-07-19 14:53 2 3221 推薦指數:

查看詳情

Spark 2.2.0 文檔中文版 Collaborative Filtering 協同過濾 JAVA推薦系統

  協同過濾常用於推薦系統,這項技術旨在填補 丟失的user-item關聯矩陣 的條目,spark.ml目前支持基於模型的協同過濾(用一些丟失條目的潛在因素在描述用戶和產品)。spark.ml使用ALS(交替最小二乘法)去學習這些潛在因素。在spark.ml中的實現有以下參數 ...

Thu Jul 20 00:30:00 CST 2017 0 2192
Spark權威指南(中文版)----第1章Apache Spark是什么

Spark The Definitive Guide Spark權威指南 中文版。關注公眾號,閱讀中文版Spark權威指南,系統學習Spark大數據框架! Apache Spark是一個統一的分布式內存計算引擎,包括一組用於在計算機集群上進行並行數據處理的函數庫。截止目前,Spark ...

Thu Aug 19 23:48:00 CST 2021 0 121
Spark Streaming Programming Guide

參考,http://spark.incubator.apache.org/docs/latest/streaming-programming-guide.html Overview SparkStreaming支持多種流輸入,like Kafka, Flume, Twitter ...

Sat Feb 22 02:19:00 CST 2014 0 2418
Scrum Guide - Scrum指南中文版

  現在公司在使用敏捷開發模式進行日常的開發和管理工作,所以我看了下Ken Schwaber的《Scrum Guide》這本小冊子,原本是英文的,這里提供中文的,以供日后復習和參考。 Scrum簡介   自從上世紀90年代初期,Scrum方法就已經應用於開發復雜的產品。本指南介紹了如何應用 ...

Wed Dec 23 08:59:00 CST 2015 1 2100
Spark系列:PythonSpark編程指南

目錄 一、介紹 二、連接Spark 三、創建RDD 四、RDD常用的轉換 Transformation 五、RDD 常用的執行動作 Action 二、連接Spark Spark1.3.0只支持Python2.6或更高的版本(但不支持Python3)。它使用了標准的CPython ...

Sun Aug 09 02:56:00 CST 2020 0 3856
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM