原文:京東:Flink SQL 優化實戰

簡介:本文着重從 shuffle join 方式的選擇 對象重用 UDF 重用等方面介紹了京東在 Flink SQL 任務方面做的優化措施。 本文作者為京東算法服務部的張穎和段學浩,並由 Apache Hive PMC,阿里巴巴技術專家李銳幫忙校對。主要內容為: 背景 Flink SQL 的優化 總結 一 背景 目前,京東搜索推薦的數據處理流程如上圖所示。可以看到實時和離線是分開的,離線數據處理大 ...

2021-08-11 10:16 0 141 推薦指數:

查看詳情

flink入門到實戰(2)flink優化總結

一、高性能Flink SQL優化技巧 1、Group Aggregate優化技巧 開啟MicroBatch或MiniBatch(提升吞吐) MicroBatch和MiniBatch都是微批處理,只是微批的觸發機制略有不同。原理同樣是緩存一定的數據后再觸發處理,以減少對State的訪問 ...

Thu May 07 19:01:00 CST 2020 0 2754
Flink SQL Client綜合實戰

Client的基本功能,今天來通過實戰更深入學習和體驗Flink SQL實戰內容 本次實戰主要是通過 ...

Tue Nov 17 18:45:00 CST 2020 4 2484
批量SQL優化實戰

有時在工作中,我們需要將大量的數據持久化到數據庫中,如果數據量很大的話直接插入的執行速度非常慢,並且由於插入操作也沒有太多能夠進行sql優化的地方,所以只能從程序代碼的角度進行優化。所以本文將嘗試使用幾種不同方式對插入操作進行優化,看看如何能夠最大程度的縮短SQL執行時間。 以插入1000條數 ...

Wed Apr 07 17:02:00 CST 2021 0 257
Flink實戰(六) - Table API & SQL編程

1 意義 1.1 分層的 APIs & 抽象層次 Flink提供三層API。 每個API在簡潔性和表達性之間提供不同的權衡,並針對不同的用例。 而且Flink提供不同級別的抽象來開發流/批處理應用程序 最低級抽象只提供有狀態流。它通過Process Function ...

Mon Jul 22 06:38:00 CST 2019 4 432
Flink原理、實戰與性能優化讀書筆記

第一章 ApacheFlink介紹 一、Flink優勢 二、Flink的應用場景 三、Flink基本組件棧 第二章 Flink環境准備 一、運行環境要求 二、Flink項目模板 Notes: Maveny依賴要注意scope改為 ...

Thu Sep 05 19:52:00 CST 2019 0 5272
Flink&Blink【編程模型、核心概念、SQL代碼實戰

一.Flink新特性   1.支持Scala2.12   2.對SQL功能進行完善     a.Streaming SQL新增Temporal Tables【時態表】       時態表:時態表記錄了數據改變的歷史狀態,該表可以返回特定時間點的表的內容。     b.Streaming ...

Sun Mar 01 01:58:00 CST 2020 0 2613
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM