從零自學Hadoop(23)：Impala介紹及安裝

本文轉載自查看原文 2017-05-31 10:42 1199 01.Hadoop/ 從零自學Hadoop/ Linux/ HDP/ Hadoop/ 自學/ Impala

閱讀目錄

序
介紹
安裝
系列索引

本文版權歸mephisto和博客園共有，歡迎轉載，但須保留此段聲明，並給出原文鏈接，謝謝合作。

文章是哥(mephisto)寫的，SourceLink

序

上一篇，我們講述了HBase的協處理器。

　下面我們開始介紹Impala的介紹及安裝。

介紹

一：定義

　　Impala是Cloudera公司主導開發的新型查詢系統，它提供SQL語義，能查詢存儲在Hadoop的HDFS和HBase中的PB級大數據。和Hive相比，速度快了個數量級，具有非常好的交互式SQL執行。

三：架構

　

Impala Daemon

　　是Impala的核心進程，進程名叫做：impalad，運行在所有的數據節點上，可以讀寫數據，並接收客戶端的查詢請求，並行執行來自集群中其他節點的查詢請求，將中間結果返回給調度節點。調用節點將結果返回給客戶端。

Impala Statestore

　　狀態管理進程，定時檢查The Impala Daemon的健康狀況，協調各個運行impalad的實例之間的信息關系，Impala正是通過這些信息去定位查詢請求所要的數據，進程名叫做 statestored，在集群中只需要啟動一個這樣的進程，如果Impala節點由於物理原因、網絡原因、軟件原因或者其他原因而下線，Statestore會通知其他節點，避免查詢任務分發到不可用的節點上。

Impala Catalog Service

　　元數據管理服務，進程名叫做 catalogd，將數據表變化的信息分發給各個進程。

安裝

一：新增服務

　　

二：勾選Impala

　　

三：分配服務

　　

　　

四：存儲配置

　　

五：添加服務進行中

　　

六：添加完成

　　

　　

　　

--------------------------------------------------------------------

　　到此，本章節的內容講述完畢。

系列索引

　　【源】從零自學Hadoop系列索引

本文版權歸mephisto和博客園共有，歡迎轉載，但須保留此段聲明，並給出原文鏈接，謝謝合作。

文章是哥(mephisto)寫的，SourceLink

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 從零自學Hadoop(14)：Hive介紹及安裝 Impala-Impala的安裝如何安裝使用Impala Impala的安裝和使用 impala安裝筆記（Ubuntu）從零自學Hadoop(06)：集群搭建從零自學Hadoop(12)：Hadoop命令中 Impala1.2.4安裝和配置 Impala 3.3.0 源碼編譯安裝 python連接impala（安裝impyla）