不多說,直接上干貨!
Kudu-Impala 集成特性
CREATE / ALTER / DROP TABLE
Impala 支持使用 Kudu 作為持久層來 creating(創建),altering(修改)和 dropping(刪除)表。這些表遵循與 Impala 中其他表格相同的 Internal / external(內部 / 外部)方法,允許靈活的數據采集和查詢。
INSERT
數據可以使用與那些使用 HDFS 或 HBase 持久性的任何其他 Impala 表相同的語法插入 Impala 中的 Kudu 表。
UPDATE / DELETE
Impala 支持 UPDATE 和 DELETE SQL 命令逐行或批處理修改 Kudu 表中的已有的數據。選擇 SQL 命令的語法與現有標准盡可能兼容。除了簡單 DELETE 或 UPDATE 命令之外,還可以 FROM 在子查詢中指定帶有子句的復雜連接。
Flexible Partitioning(靈活分區)
與 Hive 中的表分區類似,Kudu 允許您通過 hash 或范圍動態預分割成預定義數量的 tablets,以便在集群中均勻分布寫入和查詢。您可以通過任意數量的 primary key(主鍵)列,任意數量的 hashes 和可選的 list of split rows 來進行分區。參見模式設計。
Parallel Scan(並行掃描)
為了在現代硬件上實現最高的性能,Impala 使用的 Kudu 客戶端可以跨多個 tablets 掃描。
High-efficiency queries(高效查詢)
在可能的情況下,Impala 將謂詞評估下推到 Kudu,以便使謂詞評估為盡可能接近數據。在許多任務中,查詢性能與 Parquet 相當。
有關使用 Impala 查詢存儲在 Kudu 中的數據的更多詳細信息,請參閱 Impala 文檔。
同時,大家可以關注我的個人博客:
http://www.cnblogs.com/zlslch/ 和 http://www.cnblogs.com/lchzls/ http://www.cnblogs.com/sunnyDream/
詳情請見:http://www.cnblogs.com/zlslch/p/7473861.html
人生苦短,我願分享。本公眾號將秉持活到老學到老學習無休止的交流分享開源精神,匯聚於互聯網和個人學習工作的精華干貨知識,一切來於互聯網,反饋回互聯網。
目前研究領域:大數據、機器學習、深度學習、人工智能、數據挖掘、數據分析。 語言涉及:Java、Scala、Python、Shell、Linux等 。同時還涉及平常所使用的手機、電腦和互聯網上的使用技巧、問題和實用軟件。 只要你一直關注和呆在群里,每天必須有收獲
對應本平台的討論和答疑QQ群:大數據和人工智能躺過的坑(總群)(161156071)