【文章推薦】Flink SQL 寫 hudi

原文：Flink SQL 寫 hudi

Flink SQL 寫 hudi 最近在做一個數據湖項目，基於 Hudi 的湖倉一體項目，計算引擎是 Flink Spark 之前稍稍研究了一下數據湖的三個主要技術組件 IceBerg，以為可能會用，在網上看資料的時候，同樣也發現，IceBerg 對 Flink 比較親和，Hudi 對 Spark 比較親和一直以為會選 IceBerg，沒想到 IceBerg 還有很多功能沒有實現，相對來說 H ...

2021-07-19 08:17 0 735 推薦指數：

查看詳情

Hudi-Flink SQL實時讀取Hudi表數據

代碼如下（hudi表實時寫入參考上一篇[Hudi-Flink消費kafka將增量數據實時寫入Hudi]） ...

flink sql 寫 kudu

Kudu 是現在比較火的一款存儲引擎，集HDFS的順序讀和HBase的隨機讀於一身，非常適合物流網場景，剛剛到達的數據就馬上要被終端用戶使用訪問到,未來還要做大規模的數據分析。 kudu 適合的場景 ...

Flink MySQL cdc分別sink到ES、Kafka、Hudi並通過spark-sql加載Hudi表

hadoop、spark、flink、kafka、zookeeper安裝參照本博客部署安裝組件版本選擇 maven安裝(版本>=3.3.1) Hudi安裝 flink cdc編譯安裝 flink集群添加cdc jar flink cdc測試 ...

Flink 1.10 SQL 寫HBase

Hbase 也是我們很常用的數據存儲組件，所以提前嘗試下用SQL 寫Hbase，中間也遇到一些坑，跟大家分享一下。官網地址：https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table ...

Flink 1.10 SQL 寫ElasticSearch

官網對應頁面：https://ci.apache.org/projects/flink/flink-docs-release-1.10/dev/table/connect.html#elasticsearch-connector Flink SQL ElasticSearch connector ...

Flink sql 寫 Hbase 忽略空列

數倉場景下，經常有兩個表 Join 后往一個寬表寫數據。比如：埋點數據中只包含 user_id，但是下游計算的需要使用用戶的其他屬性，就需要將埋點數據和用戶數據做關聯。實時場景，需要做流表 Join，用埋點數據的 user_id 去全量用戶表中取用戶屬性。如果兩部分數據產生的順序不確定 ...

Flink SQL 流式寫數據到 Hive

Flink 1.11 版本對SQL的優化是很多的，其中最重要的一點就是 hive 功能的完善，不再只是作為持久化的 Catalog，而是可以用原生的 Flink SQL 流式的寫數據到入 hive中本文使用官網 “Streaming Writing” 案例（https ...

Apache Hudi與Apache Flink集成

感謝王祥虎@wangxianghu 投稿 Apache Hudi是由Uber開發並開源的數據湖框架，它於2019年1月進入Apache孵化器孵化，次年5月份順利畢業晉升為Apache頂級項目。是當前最為熱門的數據湖框架之一。 1. 為何要解耦 Hudi自誕生至今一直使用Spark ...

原文：Flink SQL 寫 hudi

相關推薦

相關標簽