Flink batch/stream編程套路

本文轉載自查看原文 2020-03-07 23:06 734 Flink 流處理編程思路/ Flink 批處理編程思路/ Flink DataSet編程思路/ Flink/ Flink DataStream編程思路

DataSet and DataStream 這里以WordCount為例，共同的編程套路如下所示： 1.獲取執行環境(execution environment) final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); 2.加載/創建初始數據集 // 讀取輸入數據
DataStream<String> text; if (params.has("input")) { // 讀取text文件
    text = env.readTextFile(params.get("input")); } else { System.out.println("Executing WordCount example with default input data set."); System.out.println("Use --input to specify file input."); // 讀取默認測試數據集
    text = env.fromElements(WordCountData.WORDS); } 3.對數據集進行各種轉換操作(生成新的數據集) DataStream<Tuple2<String, Integer>> counts =
                    // 切分每行單詞
                    text.flatMap(new Tokenizer()) //對每個單詞分組統計詞頻數
                    .keyBy(0).sum(1); 4.指定將計算的結果放到何處去 // 輸出統計結果
if (params.has("output")) { //寫入文件地址
    counts.writeAsText(params.get("output")); } else { System.out.println("Printing result to stdout. Use --output to specify output path."); //數據打印控制台
 counts.print(); } 5.觸發APP執行 // 執行flink 程序
env.execute("Streaming WordCount");

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Flink 編程接口（Flink SQL Table API DataStream API 和 DataSet API Stateful Stream Process API） <譯>Flink編程指南 Stream-快速入門Stream編程流式計算（四）-Flink Stream API 篇二 Flink| 狀態管理| 狀態編程 Flink實戰(七) - Time & Windows編程報錯：Flink Could not resolve substitution to a value: ${akka.stream.materializer} java 8 stream sql left join =》 jooq & Flink & Scala Spring Cloud Stream教程（五）編程模型 Flink實戰(六) - Table API & SQL編程