原文:Hive学习之路 (一)Hive初识

Hive 简介 什么是Hive Hive 由 Facebook 实现并开源 是基于 Hadoop 的一个数据仓库工具 可以将结构化的数据映射为一张数据库表 并提供 HQL Hive SQL 查询功能 底层数据是存储在 HDFS 上 Hive的本质是将 SQL 语句转换为 MapReduce 任务运行 使不熟悉 MapReduce 的用户很方便地利用 HQL 处理和计算 HDFS 上的结构化的数据, ...

2018-04-03 19:49 10 131112 推荐指数:

查看详情

Hive学习之路 (二)Hive安装

Hive的下载 下载地址http://mirrors.hust.edu.cn/apache/ 选择合适的Hive版本进行下载,进到stable-2文件夹可以看到稳定的2.x的版本是2.3.3 Hive的安装 1、本人使用MySQL做为Hive的元数据库,所以先安装MySQL ...

Wed Apr 04 03:50:00 CST 2018 7 30846
Hive学习之路 (八)Hive中文乱码

Hive注释中文乱码 创建表的时候,comment说明字段包含中文,表成功创建成功之后,中文说明显示乱码 这是因为在MySQL中的元数据出现乱码 针对元数据库metastore中的表,分区,视图的编码设置 因为我们知道 metastore 支持数据库级别,表级别的字符集 ...

Sun Apr 08 01:25:00 CST 2018 1 23014
Hive学习之路 (十八)Hive的Shell操作

一、Hive的命令行 1、Hive支持的一些命令 Command Description quit Use quit or exit to leave the interactive shell. set key=value Use this to set value ...

Sun Apr 15 23:40:00 CST 2018 0 9820
Hive学习之路 (五)DbVisualizer配置连接hive

一、安装DbVisualizer 下载地址http://www.dbvis.com/ 也可以从网上下载破解版程序,此处使用的版本是DbVisualizer 9.1.1 具体的安装步骤可以百度,或是修改安装目录之后默认安装就可以 二、配置DbVisualizer里的hive jdbc ...

Thu Apr 05 22:44:00 CST 2018 6 17436
Hive学习之路 (十九)Hive的数据倾斜

1、什么是数据倾斜? 由于数据分布不均匀,造成数据大量的集中到一点,造成数据热点 2、Hadoop 框架的特性   A、不怕数据大,怕数据倾斜   B、Jobs 数比较多的作业运行效率相对比较 ...

Sun Apr 15 23:41:00 CST 2018 2 20971
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM