Kudu-Impala集成特性

本文轉載自查看原文 2017-09-28 16:53 2191 Kudu（一款介於hdfs和hbase之間的高速分布式列式存儲數據庫）

　　不多說，直接上干貨！

Kudu-Impala 集成特性

　　CREATE / ALTER / DROP TABLE

　　Impala 支持使用 Kudu 作為持久層來 creating（創建），altering（修改）和 dropping（刪除）表。這些表遵循與 Impala 中其他表格相同的 Internal / external（內部 / 外部）方法，允許靈活的數據采集和查詢。

　　INSERT

　　數據可以使用與那些使用 HDFS 或 HBase 持久性的任何其他 Impala 表相同的語法插入 Impala 中的 Kudu 表。

　　UPDATE / DELETE

　　Impala 支持 UPDATE 和 DELETE SQL 命令逐行或批處理修改 Kudu 表中的已有的數據。選擇 SQL 命令的語法與現有標准盡可能兼容。除了簡單 DELETE 或 UPDATE 命令之外，還可以 FROM 在子查詢中指定帶有子句的復雜連接。

　　Flexible Partitioning（靈活分區）

　　與 Hive 中的表分區類似，Kudu 允許您通過 hash 或范圍動態預分割成預定義數量的 tablets，以便在集群中均勻分布寫入和查詢。您可以通過任意數量的 primary key（主鍵）列，任意數量的 hashes 和可選的 list of split rows 來進行分區。參見模式設計。

　　Parallel Scan（並行掃描）

　　為了在現代硬件上實現最高的性能，Impala 使用的 Kudu 客戶端可以跨多個 tablets 掃描。

　　High-efficiency queries（高效查詢）

　　在可能的情況下，Impala 將謂詞評估下推到 Kudu，以便使謂詞評估為盡可能接近數據。在許多任務中，查詢性能與 Parquet 相當。

　　有關使用 Impala 查詢存儲在 Kudu 中的數據的更多詳細信息，請參閱 Impala 文檔。

歡迎大家，加入我的微信公眾號：大數據躺過的坑人工智能躺過的坑 Java從入門到架構師

同時，大家可以關注我的個人博客：

http://www.cnblogs.com/zlslch/ 和 http://www.cnblogs.com/lchzls/ http://www.cnblogs.com/sunnyDream/

詳情請見：http://www.cnblogs.com/zlslch/p/7473861.html

　　人生苦短，我願分享。本公眾號將秉持活到老學到老學習無休止的交流分享開源精神，匯聚於互聯網和個人學習工作的精華干貨知識，一切來於互聯網，反饋回互聯網。
　　目前研究領域：大數據、機器學習、深度學習、人工智能、數據挖掘、數據分析。語言涉及：Java、Scala、Python、Shell、Linux等。同時還涉及平常所使用的手機、電腦和互聯網上的使用技巧、問題和實用軟件。只要你一直關注和呆在群里，每天必須有收獲

對應本平台的討論和答疑QQ群：大數據和人工智能躺過的坑（總群）（161156071）

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 kudu和kudu-impala的安裝流程實戰kudu集成impala impala記錄-安裝kudu和impala impala 和 kudu 小記 kudu導入文件（基於impala） Kudu+Impala介紹 Kudu+Impala介紹通過Impala創建Kudu表 Hbase | Hive | Impala | Kudu 區別 impala和kudu使用的小細節