原文:[源码解析] Flink的groupBy和reduce究竟做了什么

源码解析 Flink的groupBy和reduce究竟做了什么 目录 源码解析 Flink的groupBy和reduce究竟做了什么 x 摘要 x 问题和概括 . 问题 . 概括 x 背景概念 . MapReduce细分 . MapReduce细分 . Combine . Partition . Shuffle . Reducer x 代码 x 从Flink JAVA API入手挖掘 . Gro ...

2020-06-09 20:28 0 2654 推荐指数:

查看详情

[源码解析] Flink UDAF 背后做了什么

[源码解析] Flink UDAF 背后做了什么 目录 [源码解析] Flink UDAF 背后做了什么 0x00 摘要 0x01 概念 1.1 概念 1.2 疑问 1.3 UDAF示例代码 ...

Wed Aug 12 15:50:00 CST 2020 0 722
flink on yarn部分源码解析

转发请注明原创地址:https://www.cnblogs.com/dongxiao-yang/p/9403427.html flink任务的deploy形式有很多种选择,常见的有standalone,on yarn , Meos , Kubernetes等方式,目前公司内部统一采用 ...

Fri Aug 03 20:24:00 CST 2018 0 2047
Flink GroupBy与Window的关系

不带时间窗口的的groupby 会来一条数据进行一条数据的更新操作。这个时候结果是incrment的状态,每次都是覆盖(包含)了上次的结果。 带时间窗口的groupby 会对时间窗口内的一批数据进行处理。这个结果是segment的状态,与窗口个数对应。 ...

Fri Nov 15 22:38:00 CST 2019 0 294
Flink 源码解析》—— 源码编译运行

更新一篇知识星球里面的源码分析文章,去年写的,周末自己录了个视频,大家看下效果好吗?如果好的话,后面补录发在知识星球里面的其他源码解析文章。 前言 之前自己本地 clone 了 Flink源码,编译过,然后 share 到了 GitHub 上去了,自己也写了一些源码的中文注释 ...

Tue Apr 09 03:09:00 CST 2019 0 1956
源码Flink sql 流式去重源码解析

本文基于 flink 1.12.0 之前尝试了一下 flink sql 的 去重和Top n 功能,只是简单的看了下官网,然后用 sql 实现了功能,但是还有些疑问没有解决。比如:不使用 mini-batch 模式,去重的结果很单一,降序就只输出第一条数据(升序就一直输出最后一条) 为了解 ...

Thu Mar 18 05:12:00 CST 2021 0 555
Flink 源码解析 —— 深度解析 Flink 序列化机制

Flink 序列化机制 https://t.zsxq.com/JaQfeMf 博客 1、Flink 从0到1学习 —— Apache Flink 介绍 2、Flink 从0到1学习 —— Mac 上搭建 Flink 1.6.0 环境并构建运行简单程序入门 3、Flink 从0到1学习 ...

Wed Aug 14 05:48:00 CST 2019 0 379
Flink 源码解析 —— 深度解析 Flink 是如何管理好内存的?

前言 如今,许多用于分析大型数据集的开源系统都是用 Java 或者是基于 JVM 的编程语言实现的。最着名的例子是 Apache Hadoop,还有较新的框架,如 Apache Spark、Apache Drill、Apache Flink。基于 JVM 的数据分析引擎面临的一个常见挑战 ...

Mon Aug 12 16:13:00 CST 2019 0 1002
【大数据】深入源码解析Map Reduce的架构

这几天学习了MapReduce,我参照资料,自己又画了两张MapReduce的架构图。 这里我根据架构图以及对应的源码,来解释一次分布式MapReduce的计算到底是怎么工作的。 ​话不多说,开始! 首先,结合我画的架构图来进行解释。 上图是MapReduce ...

Wed Sep 23 17:40:00 CST 2020 0 433
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM