Apache Zeppelin是什么?


 Apache Zeppelin提供了web版的類似ipython的notebook,用於做數據分析和可視化。背后可以接入不同的數據處理引擎,包括spark, hive, tajo等,原生支持scala, java, shell, markdown等。它的整體展現和使用形式和Databricks Cloud是一樣的,就是來自於當時的demo。

 

     Zeppelin是一個Apache的孵化項目.
一個基於web的筆記本,支持交互式數據分析。你可以用SQL、Scala等做出數據驅動的、交互、協作的文檔。(類似於ipython notebook,可以直接在瀏覽器中寫代碼、筆記並共享)

 

 

多用途筆記本

可實現你所需要的: 
數據采集 
數據發現 
數據分析 
數據可視化和協作

支持多種語言,默認是scala(背后是Spark shell),SparkSQL, Markdown 和 Shell。 
這里寫圖片描述 
甚至可以添加自己的語言支持。

 

 

Apache Spark 集成

Zeppelin 提供了內置的 Apache Spark 集成。你不需要單獨構建一個模塊、插件或者庫。 
Zeppelin的Spark集成提供了: 
自動引入SparkContext 和 SQLContext 
從本地文件系統或maven庫載入運行時依賴的jar包。
可取消job 和 展示job進度

 

 

 

數據可視化

一些基本的圖表已經包含在Zeppelin中。可視化並不只限於SparkSQL查詢,后端的任何語言的輸出都可以被識別並可視化。 
這里寫圖片描述

 

 

 

動態表格

Zeppelin 可以在你的筆記本中動態地創建一些輸入格式。 
這里寫圖片描述 
更多關於動態表格

 

 

協作

Notebook 的 URL 可以在協作者間分享。 Zeppelin 然后可以實時廣播任何變化,就像在 Google docs 中一樣。 
這里寫圖片描述

 

 

發布

Zeppelin 提供了一個 URL 用來僅僅展示結果,那個頁面不包括 Zeppelin 的菜單和按鈕。這樣,你可以輕易地將其作為一個iframe集成到你的網站。 
這里寫圖片描述

 

 

100% 開源

Apache Zeppelin (孵化中) 是 Apache2 許可軟件。 請查看源碼庫 和 如何貢獻

Zeppelin 有着非常活躍的開發社區。加入郵件列表和在我們的問題跟蹤上報告問題has a very active development community. Join the Mailing list and report issues on our Issue tracker.

以上翻譯自Apache Zeppelin (incubating)官網。 
由於目前並不提供binary安裝包,需要自己編譯。

 

 

 

 

 

如果有一個工具,可以讓你在同一個Web頁面上寫Shell代碼,Python代碼,Scala代碼,你想要么? 
如果還可以執行PySpark代碼和Spark代碼呢?心動了嗎? 
如果還可以寫Hive-SQL,Spark-SQL呢? 
如果還可以把這些代碼保存起來,並形成文檔,支持Markdown語法,如何? 
如果還可以將SQL的結果在Web界面上可視化出來呢? 
如果還支持R語言,還支持Kylin呢?還支持Angular呢?還支持PostgreSQL呢?不信你不心動。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM