原文:Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南

Spark Streaming 编程指南 概述 一个入门示例 基础概念 依赖 初始化 StreamingContext Discretized Streams DStreams 离散化流 Input DStreams 和 Receivers 接收器 DStreams 上的 Transformations 转换 DStreams 上的输出操作 DataFrame 和 SQL 操作 MLlib 操作 ...

2017-12-26 14:31 0 1043 推荐指数:

查看详情

Spark 2.2.0 文档中文Spark Programming Guide 编程指南

  综述:   在高层中,每个spark应用由一个运行用户主函数的driver program和执行各种集群上的parallel operations所组成。spark最主要的概念:RDD弹性分布式数据集,它是一个跨越“可并行操作集群”所有节点的基本分区的集合。RDDs可被多种方式创建 ...

Wed Jul 19 22:53:00 CST 2017 2 3221
Spark Streaming编程指南

Overview A Quick Example Basic Concepts Linking Initializing StreamingContext ...

Sat Feb 10 00:05:00 CST 2018 0 3317
Spark Streaming 编程入门指南

Spark Streaming 是核心Spark API的扩展,可实现实时数据流的可伸缩,高吞吐量,容错流处理。可以从许多数据源(例如Kafka,Flume,Kinesis或TCP sockets)中提取数据,并且可以使用复杂的算法处理数据,这些算法用高级函数表示,如map、reduce、join ...

Sat Apr 11 22:19:00 CST 2020 0 1138
Spark 3.2.1 Structured Streaming编程指南

一.概述 Structured Streaming是一个可扩展、容错的流处理引擎,建立在Spark SQL引擎之上。开发者可以用离线批处理数据相同的表示来表示流计算的逻辑,并且保持其逻辑的一致性(流批一体)。Spark SQL引擎会处理好增量连续运行,并随着流式数据的接收持续更新最终结果。开发者 ...

Fri Apr 08 01:58:00 CST 2022 0 627
Spark权威指南(中文版)----第1章Apache Spark是什么

Spark The Definitive Guide Spark权威指南 中文版。关注公众号,阅读中文版的Spark权威指南,系统学习Spark大数据框架! Apache Spark是一个统一的分布式内存计算引擎,包括一组用于在计算机集群上进行并行数据处理的函数库。截止目前,Spark ...

Thu Aug 19 23:48:00 CST 2021 0 121
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM