原文:Hive -- Hive面试题及答案sql语句 ---阿善有时间看

向导 数据结构 视频表 用户表 需求描述 解答 . 统计视频观看数Top . 统计视频类别热度Top . 统计出视频观看数最高的 个视频的所属类别以及类别包含Top 视频的个数 . 统计视频观看数Top 所关联视频的所属类别排序 . 统计每个类别中的视频热度,视频流量,观看数Top . 统计上传视频最多的用户Top 以及他们上传的观看次数在前 的视频 数据结构 视频表 用户表 需求描述 统计影音 ...

2020-10-19 22:13 0 554 推荐指数:

查看详情

Hive面试题整理(一) ---阿有用

Hive面试题整理(一) 1、Hive表关联查询,如何解决数据倾斜的问题?(☆☆☆☆☆)   1)倾斜原因:map输出数据按key Hash的分配到reduce中,由于key分布不均匀、业务数据本身的特、建表时考虑不周、等原因造成的reduce 上的数据量差异过大。  (1)key分布不均匀 ...

Tue Oct 20 01:34:00 CST 2020 0 445
(七)Hive的5个面试题

一、求单月访问次数和总访问次数 1、数据说明 数据字段说明 数据格式 2、数据准备 (1)创建表 (2)导 ...

Fri May 24 18:38:00 CST 2019 0 605
hive面试题

1. 什么是hive? hive是基于Hadoop的一个数据仓库工具,可以将结构化和半结构化的数据文件映射为一张数据库表, 并提供简单的sql查询功能。 注意: (1)Hive本质是将HDFS转换成MapReduce的任务进行运算,底层由HDFS来提供数据存储。 (2)Hive的元数据存储 ...

Sun Apr 03 06:12:00 CST 2022 0 1254
一道hive SQL面试题

一、hive中实现方法 基表: 组表: gt gid gname 1001 g1 1002 g2 ...

Wed Sep 27 21:04:00 CST 2017 0 4490
Hive SQL 优化面试题整理

Hive优化目标 在有限的资源下,执行效率更高 常见问题: 数据倾斜 map数设置 reduce数设置 其他 Hive执行 HQL --> Job --> Map/Reduce 执行计划 explain [extended] hql ...

Tue Aug 18 00:19:00 CST 2020 0 2938
Hive优化面试题

对待像我这种2年开发经验的同学 一般都会被问到。 在面试中,我们只要简短的介绍就好了。 首先低调一波,我可能懂的比你少,我就简单说说 1.在排序中,我们使用的是sortBy,它是基于索引,效率高于order by 2.我们在分区的时候采用静态分区,静态分区只是读取配置文件,而动态分区需要 ...

Wed Aug 07 05:24:00 CST 2019 0 390
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM