原文:Spark Streaming笔记——技术点汇总

目录 概况 原理 API DStream WordCount示例 Input DStream Transformation Operation Output Operation 缓存与持久化 Checkpoint 性能调优 降低批次处理时间 设置合理批次时间间隔 内存调优 概况 . SparkStreaming支持实时数据流的可扩展 scalable 高吞吐 high throughput 容错 ...

2017-08-04 09:00 1 10398 推荐指数:

查看详情

Spark笔记——技术汇总

目录 · 概况 · 手工搭建集群 · 引言 · 安装Scala · 配置文件 · 启动与测试 · 应用部署 · 部署架构 · 应用程序 ...

Wed Aug 02 16:59:00 CST 2017 2 1255
Spark SQL笔记——技术汇总

目录 · 概述 · 原理 · 组成 · 执行流程 · 性能 · API · 应用程序模板 · 通用读写方法 · RDD转为DataFr ...

Mon Jul 31 17:02:00 CST 2017 0 8948
ZooKeeper笔记——技术汇总

目录 · ZooKeeper安装 · 分布式一致性理论 · 一致性级别 · 集中式系统 · 分布式系统 · ACID特性 · CAP理论 ...

Thu Aug 10 17:02:00 CST 2017 1 1923
Hive笔记——技术汇总

目录 · 概况 · 手工安装 · 引言 · 创建HDFS目录 · 创建元数据库 · 配置文件 · 测试 · 原理 · 架构 ...

Tue Aug 01 17:02:00 CST 2017 0 4022
Redis笔记——技术汇总

目录 · 特点 · 安装 · 数据库 · 服务器命令 · 数据类型及其操作命令 · 数据结构 · string · list · set · ...

Mon Aug 28 17:03:00 CST 2017 5 2007
JVM笔记——技术汇总

目录 · 初步认识 · Java里程碑(关键部分) · 理解虚拟机 · Java虚拟机种类 · Java语言规范 · Java虚拟机规范 · 基本 ...

Mon Aug 14 17:04:00 CST 2017 1 1134
Netty笔记——技术汇总

目录 · Linux网络IO模型 · 文件描述符 · 阻塞IO模型 · 非阻塞IO模型 · IO复用模型 · 信号驱动IO模型 · 异步I ...

Mon Aug 21 17:00:00 CST 2017 1 1185
Spark Streaming笔记整理(一):基本工作原理介绍

概述 大数据实时计算介绍 1、Spark Streaming,其实就是一种Spark提供的,对于大数据,进行实时计算的一种框架。它的底层,其实,也是基于我们之前讲解的Spark Core的。基本的计算模型,还是基于内存的大数据实时计算模型。而且,它的底层的核心组件还是我们在Spark Core ...

Mon Jul 30 23:45:00 CST 2018 0 1011
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM