Kylin的簡介與安裝部署


一.Kylin的概述

官方網址:http://kylin.apache.org/cn/

      Apache Kylin™是一個開源的分布式分析引擎,提供Hadoop/Spark之上的SQL查詢接口及多維分析(OLAP)能力以支持超大規模數據,最初由eBay Inc. 開發並貢獻至開源社區。它能在亞秒內查詢巨大的Hive表。

二.Kylin的安裝

1.安裝環境准備

1)軟件要求

  • Hadoop: 2.7+, 3.1+ (since v2.5)
  • Hive: 0.13 - 1.2.1+
  • HBase: 1.1+, 2.0 (since v2.5)
  • Spark (可選) 2.1.1+
  • Kafka (可選) 0.10.0+
  • JDK: 1.8+ (since v2.5)
  • OS: Linux only, CentOS 6.5+ or Ubuntu 16.0.4+

2)硬件要求

       運行 Kylin 的服務器的最低的配置為 4 core CPU, 16 GB memory 和 100 GB disk。 對於高負載的場景,建議使用 24 core CPU, 64 GB memory 或更高的配置。

3)Hadoop 環境

       Kylin 依賴於 Hadoop 集群處理大量的數據集。您需要准備一個配置好 HDFS, YARN, MapReduce, Hive, Hbase, Zookeeper 和其他服務的 Hadoop 集群供 Kylin 運行。最常見的是在 Hadoop client machine 上安裝 Kylin,這樣 Kylin 可以通過(hivehbasehadoop, 以及其他的)命令行與 Hadoop 進行通信。

       Kylin 可以在 Hadoop 集群的任意節點上啟動。方便起見,您可以在 master 節點上運行 Kylin。但為了更好的穩定性,我們建議您將其部署在一個干凈的 Hadoop client 節點上,該節點上 hivehbasehadoophdfs 命令行已安裝好且 client 配置如(core-site.xml, hive-site.xml, hbase-site.xml, 及其他)也已經合理的配置且其可以自動和其它節點同步。運行 Kylin 的 Linux 賬戶要有訪問 Hadoop 集群的權限,包括 create/write HDFS 文件夾, hive 表, hbase 表 和 提交 MR jobs 的權限。

2.Kylin單機安裝

1)下載

這里下載最新的適用於 HBase 1.x 的 Kylin 2.5.0

[admin@node21 software]$ wget http://mirrors.tuna.tsinghua.edu.cn/apache/kylin/apache-kylin-2.5.0/apache-kylin-2.5.0-bin-hbase1x.tar.gz

2)解壓

解壓 tar 包

[admin@node21 software]$ tar zxvf apache-kylin-2.5.0-bin-hbase1x.tar.gz -C /opt/module/
[admin@node21 software]$ cd /opt/module/
[admin@node21 module]$ mv apache-kylin-2.5.0-bin-hbase1x   kylin-2.5.0-bin-hbase1x

然后配置環境變量 KYLIN_HOME 指向 Kylin 文件夾

[admin@node21 kylin-2.5.0-bin-hbase1x]$ sudo vi /etc/profile
export KYLIN_HOME=/opt/module/kylin-2.5.0-bin-hbase1x
export PATH=$PATH:$KYLIN_HOME/bin
[admin@node21 kylin-2.5.0-bin-hbase1x]$ . /etc/profile

檢查安裝環境,如果環境有任何的問題,它會將打印出詳細的信息。如果沒有 error,意味着環境沒問題。

[admin@node21 kylin-2.5.0-bin-hbase1x]$ ./bin/check-env.sh
Retrieving hadoop conf dir...
KYLIN_HOME is set to /opt/module/kylin-2.5.0-bin-hbase1x

3)啟動Kylin

先啟動集群各個服務,然后運行 $KYLIN_HOME/bin/kylin.sh start 腳本來啟動 Kylin,服務器啟動后,您可以通過查看 $KYLIN_HOME/logs/kylin.log 獲得運行時日志。

[admin@node21 kylin-2.5.0-bin-hbase1x]$ ./bin/kylin.sh  start
Retrieving hadoop conf dir...
KYLIN_HOME is set to /opt/module/kylin-2.5.0-bin-hbase1x
Retrieving hive dependency...
Retrieving hbase dependency...
Retrieving hadoop conf dir...
Retrieving kafka dependency...
Retrieving Spark dependency...
...
A new Kylin instance is started by root. To stop it, run 'kylin.sh stop'
Check the log at /opt/module/kylin-2.5.0-bin-hbase1x/logs/kylin.log
Web UI is at http://<hostname>:7070/kylin-bash-4.1#

4)WebUI查看

  • Kylin 啟動后您可以通過瀏覽器 http://hostname:7070/kylin 查看。初始用戶名和密碼是 ADMIN/KYLIN。
  • 運行 $KYLIN_HOME/bin/kylin.sh stop 腳本,停止 Kylin。

3.Kylin集群安裝

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM