原文:Spark 2.2.0 文档中文版 Spark Programming Guide 编程指南

综述: 在高层中,每个spark应用由一个运行用户主函数的driver program和执行各种集群上的parallel operations所组成。spark最主要的概念:RDD弹性分布式数据集,它是一个跨越 可并行操作集群 所有节点的基本分区的集合。RDDs可被多种方式创建:hadoop文件系统 或者其他hadoop支持的文件系统 ,或者现有的在主程序上的scala集合。用户也要求spark ...

2017-07-19 14:53 2 3221 推荐指数:

查看详情

Spark 2.2.0 文档中文版 Collaborative Filtering 协同过滤 JAVA推荐系统

  协同过滤常用于推荐系统,这项技术旨在填补 丢失的user-item关联矩阵 的条目,spark.ml目前支持基于模型的协同过滤(用一些丢失条目的潜在因素在描述用户和产品)。spark.ml使用ALS(交替最小二乘法)去学习这些潜在因素。在spark.ml中的实现有以下参数 ...

Thu Jul 20 00:30:00 CST 2017 0 2192
Spark权威指南(中文版)----第1章Apache Spark是什么

Spark The Definitive Guide Spark权威指南 中文版。关注公众号,阅读中文版Spark权威指南,系统学习Spark大数据框架! Apache Spark是一个统一的分布式内存计算引擎,包括一组用于在计算机集群上进行并行数据处理的函数库。截止目前,Spark ...

Thu Aug 19 23:48:00 CST 2021 0 121
Spark Streaming Programming Guide

参考,http://spark.incubator.apache.org/docs/latest/streaming-programming-guide.html Overview SparkStreaming支持多种流输入,like Kafka, Flume, Twitter ...

Sat Feb 22 02:19:00 CST 2014 0 2418
Scrum Guide - Scrum指南中文版

  现在公司在使用敏捷开发模式进行日常的开发和管理工作,所以我看了下Ken Schwaber的《Scrum Guide》这本小册子,原本是英文的,这里提供中文的,以供日后复习和参考。 Scrum简介   自从上世纪90年代初期,Scrum方法就已经应用于开发复杂的产品。本指南介绍了如何应用 ...

Wed Dec 23 08:59:00 CST 2015 1 2100
Spark系列:PythonSpark编程指南

目录 一、介绍 二、连接Spark 三、创建RDD 四、RDD常用的转换 Transformation 五、RDD 常用的执行动作 Action 二、连接Spark Spark1.3.0只支持Python2.6或更高的版本(但不支持Python3)。它使用了标准的CPython ...

Sun Aug 09 02:56:00 CST 2020 0 3856
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM