Zeppelin源碼


1.概述

  在大數據應用場景中,處理數據分析方面,由於開發者的水平不一樣,使用的編程語言也不盡相同,可能會涉及到R、Python、Java、Scala等,數據計算模型也估計不一樣,可能涉及的有Spark、Hive、Flink、Kylin等等。本篇博客筆者給大家介紹的內容並不是告訴大家如何去使用。在《Zeppelin使用心得》中有介紹如何使用,這里就不多做贅述了,今天主要是給大家剖析Zeppelin的源碼模塊。

2.內容

  目前Zeppelin官方已經發布版本為0.7.3,源碼帶托管在Github上,大家可以先將Zeppelin的源碼在Github上下載下來。Zeppelin的項目結構是以Maven的形式存在的,由多個Module構成,分為框架核心Module和其他Interpreter Module,源碼結構如下圖所示:

  從截圖中可以看出,其實Zeppelin到目前為止,集成了很多插件,比如Beam、HBase、ES、Flink、Kylin、Pig等,這些都是平時大數據場景下常用的。

2.1 模塊分析

  Zeppelin的入口是ZeppelinServer(在zeppelin-server模塊下)這個類下的Main函數,通過Jetty內嵌服務器提供WebSocket服務和Restful服務,還基於Shiro提供了權限認證和用戶校驗功能,都是使用Java編程語言實現的。在zeppelin-zengine模塊下,實現Notebook的持久化和檢索功能,同樣使用Java語言實現。在zeppelin-interpreter模塊下,通過調用zeppelin-zengine中的Thrift服務,來實現解釋器的交互功能。在zeppelin-web模塊下,用於腳本語言編寫以及數據的可視化,使用AngularJS前端框架實現。其他模塊詳見下表。

名稱 說明 實現語言
zeppelin-server 整個系統入口,提供服務器功能、權限認證以及用戶校驗等功能 Java
zeppelin-zengine 實現Zeppelin中Notebook的持久化和檢索功能 Java
zeppelin-interpreter 執行解釋器 Java
zeppelin-web 業務腳本語言編寫、數據分析界面、數據可視化與結果導出 AngularJS
zeppelin-display 讓前端的AngularJS元素與后台數據進行綁定,進行數據交互 Scala
zeppelin-distribution 用於存放編譯后的二進制安裝包    
zeppelin-examples 示例代碼,用於測試  
helium-dev 新特性,讓解釋器,存儲插件加入到Zeppelin中時,不需要重啟Zeppelin服務 Java

  Zeppelin項目運用了許多編程語言和框架,屬於一個混合項目。

3.源碼調試

  明白Zeppelin各個模塊的功能和作用后,我們可以嘗試去調試一下Zeppelin的源碼,這里我們將Zeppelin的源碼導入到 IDEA 編輯器,然后找到ZeppelinServer啟動,如下圖所示:

  然后選擇“Run 'ZeppelinServer.main()'”命令即可,等待服務啟動完成,啟動成功后,會在編輯器控制台打印日志,如下圖所示:

  這里,在啟動端口默認是8080,在ZeppelinConfiguration類下可以進行編輯,如下圖所示:

  然后,我們可以到瀏覽器預覽調試結果,如下圖所示:

  一般在二次開發完成Zeppelin的功能后,我們會將源代碼重新編譯打包,可以使用Maven打包命令,如下所示:

mvn clean package -Pbuild-distr -Dcheckstyle.skip=true -DskipTests

  打包完成后,會在zeppelin-distribution的target目錄下生成一個二進制的軟件安裝包。

4.關系圖

  這里筆者給大家整理了Zeppelin-0.7.3的各個Module之間的關系圖,如下所示:

5.結束語

  這篇博客就和大家分享到這里,如果大家在研究學習的過程當中有什么問題,可以加群進行討論或發送郵件給我,我會盡我所能為您解答,與君共勉。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM