Flink 學習 — Mac 上搭建 Flink 1.6.0 環境並運行單詞統計程序


准備工作

1、安裝查看 Java 的版本號,推薦使用 Java 8。

2、在 Mac OS X 上安裝 Flink 是非常方便的。推薦通過 homebrew 來安裝。

	brew install apache-flink

3、檢查安裝:

	flink --version

結果:

	Version: 1.6.0, Commit ID: ff472b4

4、啟動 flink

lr@lr /usr/local/Cellar/apache-flink/1.6.0/libexec/bin  ./start-cluster.sh
Starting cluster.
Starting standalonesession daemon on host zhisheng.
Starting taskexecutor daemon on host zhisheng.

接着就可以進入 web 頁面( http://localhost:8081/ ) 查看

demo

1、新建一個 maven 項目

創建一個 SocketTextStreamWordCount 文件,加入以下代碼:

	package com.zhisheng.flink;

import org.apache.flink.api.common.functions.FlatMapFunction;
import org.apache.flink.api.java.tuple.Tuple2;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.util.Collector;

/**
 * Created by zhisheng_tian on 2018/9/18
 */
public class SocketTextStreamWordCount {
    public static void main(String[] args) throws Exception {
        //參數檢查
        if (args.length != 2) {
            System.err.println("USAGE:\nSocketTextStreamWordCount <hostname> <port>");
            return;
        }

        String hostname = args[0];
        Integer port = Integer.parseInt(args[1]);


        // set up the streaming execution environment
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        //獲取數據
        DataStreamSource<String> stream = env.socketTextStream(hostname, port);

        //計數
        SingleOutputStreamOperator<Tuple2<String, Integer>> sum = stream.flatMap(new LineSplitter())
                .keyBy(0)
                .sum(1);

        sum.print();

        env.execute("Java WordCount from SocketTextStream Example");
    }

    public static final class LineSplitter implements FlatMapFunction<String, Tuple2<String, Integer>> {
        @Override
        public void flatMap(String s, Collector<Tuple2<String, Integer>> collector) {
            String[] tokens = s.toLowerCase().split("\\W+");

            for (String token: tokens) {
                if (token.length() > 0) {
                    collector.collect(new Tuple2<String, Integer>(token, 1));
                }
            }
        }
    }
}

接着進入工程目錄,使用以下命令打包。

	mvn clean package -Dmaven.test.skip=true

然后我們開啟監聽 9000 端口:

	nc -l 9000

最后進入 flink 安裝目錄 bin 下執行以下命令跑程序:

	flink run -c com.zhisheng.flink.SocketTextStreamWordCount /Users/zhisheng/IdeaProjects/flink/word-count/target/original-word-count-1.0-SNAPSHOT.jar	127.0.0.1 9000

注意換成你自己項目的路徑。

執行完上述命令后,我們可以在 webUI 中看到正在運行的程序:

我們可以在 nc 監聽端口中輸入 text,比如:

然后我們通過 tail 命令看一下輸出的 log 文件,來觀察統計結果。進入目錄 apache-flink/1.6.0/libexec/log,執行以下命令:

	tail -f flink-zhisheng-taskexecutor-0-zhisheng.out

注意:切換成你自己的路徑和查看自己的目錄。

總結

本文描述了如何在 Mac 電腦上安裝 Flink,及運行它。接着通過一個簡單的 Flink 程序來介紹如何構建及運行Flink 程序。

原文地址:http://www.54tianzhisheng.cn/2018/09/18/flink-install/

.

其他


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM