一、查询

基本的语法跟hive的查询语句大体一样
Impala不支持DISTRIBUTE BY（分区排序）, SORT BY（每个MR内部排序），CLUSTER BY（cluster by除了具有distribute by的功能外还兼具sort by的功能。但是排序只能是倒序排序，不能指定排序规则为ASC或者DESC）。
Impala中不支持分桶表
Impala不支持COLLECT_SET(col)和explode（col）函数
Impala支持开窗函数

[bigdata12:21000] > select name,orderdate,cost,sum(cost) over(partition by month(orderdate)) from business;

二、函数

自定义函数

1．创建一个Maven工程Hive

2．导入依赖

<groupId>org.apache.hive</groupId>

</dependency>

</dependencies>

3．创建一个类-大写转小写：

package com.itstar.hive; import org.apache.hadoop.hive.ql.exec.UDF; public class Lower extends UDF { public String evaluate (final String s) { if (s == null) { return null; } return s.toLowerCase(); } }

4．打成jar包上传到服务器/opt/module/jars/

5. 将jar包上传到hdfs的指定目录

hadoop fs -put hive-1.0-SNAPSHOT.jar /

6. 创建函数

[bigdata12:21000] > create function mylower(string) returns string location '/hive-1.0-SNAPSHOT.jar' symbol='hive.UDF_Lower';

7. 使用自定义函数

[bigdata12:21000] > select id,mylower(name) from student;

8.通过show functions查看自定义的函数

[bigdata12:21000] > show functions;

Query: show functions

+-------------+-----------------+-------------+---------------+

+-------------+-----------------+-------------+---------------+

+-------------+-----------------+-------------+---------------+

免责声明！

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 impala系列: 时间函数 Impala 数值函数 Impala String函数大全 Impala系列: Impala常用的功能函数 impala 交互式查询⼯具Impala impala 将查询数据导出为文件格式往hive中写入数据，通过impala查询不到数据，通过hive客户端可以查到数据 Hive、Sparksql、Presto、Impala、Hawq、Clickhouse、Greenplum大数据查询引擎对比（转）在cm安装的大数据管理平台中集成impala之后读取hive表中的数据的设置（hue当中执行impala的数据查询）