查詢（三）排序查詢

一、全局排序（Order By）

Order By：全局排序，一個MapReduce

1）使用 ORDER BY 子句排序

ASC（ascend）: 升序（默認）

DESC（descend）: 降序

2）ORDER BY 子句在SELECT語句的結尾。

案例實操

（1）查詢員工信息按工資升序排列

hive (default)> select * from emp order by sal;

（2）查詢員工信息按工資降序排列

hive (default)> select * from emp order by sal desc;

（3）查詢員工的信息按照工資升序，獎金降序排列

hive (default)> select ename,sal,comm from emp order by sal,comm desc;

二、按照別名排序

按照員工薪水的2倍排序

hive (default)> select ename, sal*2 twosal from emp order by twosal;

這里twosal是sal*2的別名

三、多個列排序

按照部門和工資升序排序

hive (default)> select ename, deptno, sal from emp order by deptno, sal ;

注：這個是先按部門號排序，部門號相同，再按薪水升序排序

四、每個MapReduce內部排序（Sort By）

Sort By：每個MapReduce內部進行排序，分區規則按照key的hash來運算，（區內排序）對全局結果集來說不是排序。

1）設置reduce個數

hive (default)> set mapreduce.job.reduces=3;

2）查看設置reduce個數

hive (default)> set mapreduce.job.reduces;

3）根據部門編號降序查看員工信息

hive (default)> select * from emp sort by empno desc;

4）將查詢結果導入到文件中（按照部門編號降序排序）

hive (default)> insert overwrite local directory '/opt/module/datas/emp.txt' row format delimited fields terminated by '\t' select * from emp sort by deptno desc;

五、分區排序（Distirbute By）

Distribute By：類似MR中partition，進行分區，結合sort by使用。

注意，Hive要求DISTRIBUTE BY語句要寫在SORT BY語句之前。

對於distribute by進行測試，一定要分配多reduce進行處理，否則無法看到distribute by的效果。

案例實操：

（1）按照emp表中的deptno-部門號來進行分區

hive (default)> select * from emp distribute by deptno;

（2）先按照部門編號分區，再按照員工編號降序排序。

hive (default)> set mapreduce.job.reduces=3;

hive (default)> insert overwrite local directory '/opt/module/datas/distribute-result' row format delimited fields terminated by '\t' select * from emp distribute by deptno sort by empno desc;

六、Cluster By

當distribute by和sorts by字段相同時，可以使用cluster by方式。

cluster by除了具有distribute by的功能外還兼具sort by的功能。但是排序只能是倒序排序，不能指定排序規則為ASC或者DESC。

以下兩種寫法等價

hive (default)> insert overwrite local directory '/opt/module/datas/emp3' row format delimited fields terminated by '\t' select * from emp cluster by deptno;

hive (default)> select * from emp distribute by deptno sort by deptno;

注意：按照部門編號分區，不一定就是固定死的數值，可以是20號和30號部門分到一個分區里面去。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 Hive-查詢（四）分桶及抽樣查詢 Hive-查詢（一）Select...From+Where+分組查詢 hive表查詢——排序 Hive 查詢 HIVE-計算累計和 HIVE- 數據傾斜 Hive(7)-基本查詢語句 hive查詢結果保存 Hive-行轉列（explode） HIVE-如何查看執行日志