Hive架構與工作原理

本文轉載自查看原文 2019-09-29 11:19 1223

file

組成及作用：

元數據包括：表名、表所屬的數據庫（默認是default）、表的擁有者、列/分區字段、表的類型（是否是外部表）、表的數據所在目錄等；

默認存儲在自帶的derby數據庫中，推薦使用MySQL存儲Metastore

使用HDFS進行存儲，使用MapReduce進行計算

（1）解析器（SQL Parser）：將SQL字符串轉換成抽象語法樹AST，這一步一般都用第三方工具庫完成，比如antlr；對AST進行語法分析，比如表是否存在、字段是否存在、SQL語義是否有誤。

（2）編譯器（Physical Plan）：將AST編譯生成邏輯執行計划。

（3）優化器（Query Optimizer）：對邏輯執行計划進行優化。

（4）執行器（Execution）：把邏輯執行計划轉換成可以運行的物理計划。對於Hive來說，就是MR/Spark。

工作原理：

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Flink架構及其工作原理 Hive構成及工作原理簡介 CPU的內部架構和工作原理 Kylin工作原理、體系架構 hive工作原理之SQL源碼解析 Ansible入門筆記（1）之工作架構和使用原理 zabbix監控的基礎概念、工作原理及架構深入學習Hive應用場景及架構原理 Hadoop Yarn 一文搞懂 Yarn架構原理和工作機制 Hive的原理