從零自學Hadoop(23):Impala介紹及安裝


閱讀目錄

本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文鏈接,謝謝合作。

文章是哥(mephisto)寫的,SourceLink

 

     上一篇,我們講述了HBase的協處理器。

   下面我們開始介紹Impala的介紹及安裝。

介紹

一:定義

  Impala是Cloudera公司主導開發的新型查詢系統,它提供SQL語義,能查詢存儲在Hadoop的HDFS和HBase中的PB級大數據。和Hive相比,速度快了個數量級,具有非常好的交互式SQL執行。

三:架構

 

Impala Daemon

  是Impala的核心進程,進程名叫做:impalad,運行在所有的數據節點上,可以讀寫數據,並接收客戶端的查詢請求,並行執行來自集群中其他節點的查詢請求,將中間結果返回給調度節點。調用節點將結果返回給客戶端。

Impala Statestore

  狀態管理進程,定時檢查The Impala Daemon的健康狀況,協調各個運行impalad的實例之間的信息關系,Impala正是通過這些信息去定位查詢請求所要的數據,進程名叫做 statestored,在集群中只需要啟動一個這樣的進程,如果Impala節點由於物理原因、網絡原因、軟件原因或者其他原因而下線,Statestore會通知其他節點,避免查詢任務分發到不可用的節點上。

Impala Catalog Service

  元數據管理服務,進程名叫做 catalogd,將數據表變化的信息分發給各個進程。

安裝

一:新增服務

  

二:勾選Impala

  

三:分配服務

  

  

四:存儲配置

  

五:添加服務進行中

  

 

六:添加完成

  

 

  

 

  

--------------------------------------------------------------------

  到此,本章節的內容講述完畢。

系列索引

  【源】從零自學Hadoop系列索引

 

 

 

 

本文版權歸mephisto和博客園共有,歡迎轉載,但須保留此段聲明,並給出原文鏈接,謝謝合作。

文章是哥(mephisto)寫的,SourceLink

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM