原文:Hive的學習之路(理論篇)

一 Hive介紹 Apache官網給出的logo,一半是Hadoop大象的頭,一半是蜜蜂的身體,也是寓意着它是基於Hadoop,哈哈,純屬個人理解,進入正題。 Hive是基於Hadoop的一個數據倉庫工具,可以將sql語句轉換成MapReduce任務來運行。可以用來數據提取 轉化 加載 ETL ,這是一種可以存儲 查詢和分析存儲在Hadoop中的大規模數據的機制。 Hive定義了簡單的類sql查詢 ...

2019-08-07 21:51 0 406 推薦指數:

查看詳情

Hive學習之路 (二)Hive安裝

Hive的下載 下載地址http://mirrors.hust.edu.cn/apache/ 選擇合適的Hive版本進行下載,進到stable-2文件夾可以看到穩定的2.x的版本是2.3.3 Hive的安裝 1、本人使用MySQL做為Hive的元數據庫,所以先安裝MySQL ...

Wed Apr 04 03:50:00 CST 2018 7 30846
Hive學習之路 (一)Hive初識

Hive 簡介 什么是Hive 1、Hive 由 Facebook 實現並開源 2、是基於 Hadoop 的一個數據倉庫工具 3、可以將結構化的數據映射為一張數據庫表 4、並提供 HQL(Hive SQL)查詢功能 5、底層數據是存儲在 HDFS 上 6、Hive的本質是將 SQL ...

Wed Apr 04 03:49:00 CST 2018 10 131112
Hive學習之路 (八)Hive中文亂碼

Hive注釋中文亂碼 創建表的時候,comment說明字段包含中文,表成功創建成功之后,中文說明顯示亂碼 這是因為在MySQL中的元數據出現亂碼 針對元數據庫metastore中的表,分區,視圖的編碼設置 因為我們知道 metastore 支持數據庫級別,表級別的字符集 ...

Sun Apr 08 01:25:00 CST 2018 1 23014
Hive學習之路 (十八)Hive的Shell操作

一、Hive的命令行 1、Hive支持的一些命令 Command Description quit Use quit or exit to leave the interactive shell. set key=value Use this to set value ...

Sun Apr 15 23:40:00 CST 2018 0 9820
Hive學習之路 (十九)Hive的數據傾斜

1、什么是數據傾斜? 由於數據分布不均勻,造成數據大量的集中到一點,造成數據熱點 2、Hadoop 框架的特性   A、不怕數據大,怕數據傾斜   B、Jobs 數比較多的作業運行效率相對比較 ...

Sun Apr 15 23:41:00 CST 2018 2 20971
Hive學習之路 (五)DbVisualizer配置連接hive

一、安裝DbVisualizer 下載地址http://www.dbvis.com/ 也可以從網上下載破解版程序,此處使用的版本是DbVisualizer 9.1.1 具體的安裝步驟可以百度,或是修改安裝目錄之后默認安裝就可以 二、配置DbVisualizer里的hive jdbc ...

Thu Apr 05 22:44:00 CST 2018 6 17436
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM