原文:Flink基础(十二):DS简介(12) 有状态算子和应用

状态操作符和用户自定义函数都是我们在写流处理程序时,常用的工具。事实上,大部分稍微复杂一点的逻辑都需要保存数据或者保存计算结果。很多Flink内置的操作符例如:source操作符,sink操作符等等都是有状态的,也就是说会缓存流数据或者计算结果。例如,窗口操作符将会为ProcessWindowFunction收集输入的数据,或者收集ReduceFunction计算的结果。而ProcessFunct ...

2020-08-04 11:51 0 1004 推荐指数:

查看详情

Flink基础(一):DS简介(1) 有状态的流式处理简介

0 简介   Apache Flink是一个分布式流处理器,具有直观和富有表现力的API,可实现有状态的流处理应用程序。它以容错的方式有效地大规模运行这些应用程序。 Flink于2014年4月加入Apache软件基金会作为孵化项目,并于2015年1月成为顶级项目。从一开始,Flink就拥有一个 ...

Tue Aug 04 01:16:00 CST 2020 0 1450
Flink基础(二):DS简介(2) Flink简介

1 初识 Flink   Flink 项目的理念是:“Apache Flink 是为分布式、高性能、随时可用以及准确的流处理应用程序打造的开源流处理框架”。   Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算 ...

Tue Aug 04 01:24:00 CST 2020 0 580
Flink基础(六):DS简介(6) Flink DataStream API(一)

  本章介绍了Flink DataStream API的基本知识。我们展示了典型的Flink流处理程序的结构和组成部分,还讨论了Flink的类型系统以及支持的数据类型,还展示了数据和分区转换操作。窗口操作符,基于时间语义的转换操作,有状态的操作符,以及和外部系统的连接器将在接下来的章节进行介绍 ...

Tue Aug 04 04:49:00 CST 2020 0 704
Flink基础(八):DS简介(8) Flink DataStream API(三)

1 设置并行度 Flink应用程序在一个像集群这样的分布式环境中并行执行。当一个数据流程序提交到作业管理器执行时,系统将会创建一个数据流图,然后准备执行需要的操作符。每一个操作符将会并行化到一个或者多个任务中去。每个算子的并行任务都会处理这个算子的输入流中的一份子集。一个算子并行任务的个数叫做 ...

Tue Aug 04 05:34:00 CST 2020 0 736
Flink基础(四):DS简介(4) Flink 运行架构

1 系统架构   Flink是一个用于有状态的并行数据流处理的分布式系统。它由多个进程构成,这些进程一般会分布运行在不同的机器上。对于分布式系统来说,面对的常见问题有:集群中资源的分配和管理、进程协调调度、持久化和高可用的数据存储,以及故障恢复。   对于这些分布式系统的经典问题,业内已有 ...

Tue Aug 04 02:54:00 CST 2020 0 986
Flink基础(三):DS简介(3) 流处理基础

1 数据流编程简介 在我们深入研究流处理的基础知识之前,让我们来看看在数据流程编程的背景和使用的术语。 1.1 数据流图   顾名思义,数据流程序描述了数据如何在算子之间流动。数据流程序通常表示为有向图,其中节点称为算子,用来表示计算,边表示数据之间的依赖性。算子是数据流程序的基本功能单元 ...

Tue Aug 04 01:39:00 CST 2020 0 1003
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM