原文:一个flink作业的调优

最近接手了一个flink作业,另外一个同事断断续续有的没的写了半年的,不着急,也一直没上线,最近突然要上线,扔给我,要调通上线。 现状是: .代码跑不动,资源给的不少,但是就是频繁反压。 .checkpoint经常失败。 .也是最严重的,跑着跑着,作业就挂了。 接手之后,秉承着代码的业务逻辑是对的原则,开始了调优之旅,后来发现,还是要从最基本的做起,不然都是白扯。总结了如下几条意见,供自己以后反省 ...

2018-10-11 18:37 1 5633 推荐指数:

查看详情

Flink法则

Flink法则 一. 性能定位 口诀分析 1. 看背压 通常最后一个背压高的subTask的下游就是job的明显瓶颈之一 2. 看checkoint时长 checkpoint的时长在一定程度上可以影响job的整体吞吐 3. 查看关键指标 通过延迟与吞吐指标可以对任务的性能 ...

Wed Dec 30 02:56:00 CST 2020 0 670
Flink

第1章 资源配置   Flink性能的第一步,就是为任务分配合适的资源,在一定范围内,增加资源的分配与性能的提升是成正比的,实现了最优的资源配置后,在此基础上再考虑进行后面论述的性能策略。   提交方式主要是yarn-per-job,资源的分配在使用脚本提交Flink任务时进行指定 ...

Sun Aug 22 23:50:00 CST 2021 0 121
Flink性能(一)

1 配置内存 如果频繁出现Full GC,需要优化GC 在客户端的"conf/flink-conf.yaml"配置文件中,在“env.java.opts”配置项中添加参数: -Xloggc:<LOG_DIR>/gc.log -XX:+PrintGCDetails -XX ...

Mon Apr 19 04:18:00 CST 2021 0 622
flink之RocksDB参数

下图是RocksDB的工作流程,一共进行三个步骤, ①将数据写入内存中的活跃表 Active MenTable ②将活跃表转化成只读表 ReadOnlyMemTable ③将只读表flush到本地磁盘上 LocalDish 具体方法 ①增大整块缓存,减小刷写的频率 ...

Fri Apr 15 07:13:00 CST 2022 0 1079
flink之RocksDB设置

一、开启监控 RocksDB是基于LSM Tree实现的,写数据都是先缓存到内存中,所以RocksDB的写请求效率比较高。RocksDB使用内存结合磁盘的方式来存储数据,每次获取数据时,先从内存中b ...

Mon Apr 11 03:42:00 CST 2022 0 3123
spark作业性能

spark作业性能 优化的目标 保证大数据量下任务运行成功 降低资源消耗 提高计算性能 一、开发: (1)避免创建重复的RDD RDD lineage,也就是“RDD的血缘关系链” 开发RDD lineage极其冗长的Spark作业时,创建多个代表 ...

Mon Apr 09 15:14:00 CST 2018 0 1027
Flink RocksDB参数说明

产环境中总是会适当大一些,一般32KB比较合适,对于机械硬盘可以再增大到128~256KB,充分利用其顺 ...

Mon Jan 18 20:56:00 CST 2021 0 688
Flink项目实战(二)---原理及

1、checkPoint (1.1)Flink 中的每个方法或算子都是有状态的。 状态化的方法在处理元素/事件的时候存储数据,使得状态成为使各个类型的算子重要部分。 Flink 通过为状态添加 checkpoint(检查点),使状态具备容错能力。 (1.2)Flink的CheckPoint ...

Mon Aug 30 03:42:00 CST 2021 0 111
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM