一. 基本概念(https://blog.csdn.net/xianzhen376/article/details/89810958)
雙流Join是Flink面試的高頻問題。一般情況下說明以下幾點就可以hold了:
1.join大體分類有兩種:window join和interval join。window join又可以根據window的類型細分為3種,如下:
Tumbling Window join、Sliding Window join、Session Window Join。
2. windows類型的join都是利用window的機制,先將數據緩存在window state中,當窗口觸發計算時,執行join
3. interval join也是利用state存儲數據再處理,區別在於state中的數據有失效機制,依靠數據觸發數據清理;
4. 目前Stream join的結果是數據的笛卡爾積;
5. 日常使用中的一些問題,數據延遲、window序列化相關。
二. 雙流join與傳統數據庫表join的區別