一、行轉列的使用
1、問題
hive如何將
a b 1
a b 2
a b 3
c d 4
c d 5
c d 6
變為:
a b 1,2,3
c d 4,5,6
2、數據
test.txt
a b 1
a b 2
a b 3
c d 4
c d 5
c d 6
3、答案
1.建表
drop table tmp_jiangzl_test; create table tmp_jiangzl_test ( col1 string, col2 string, col3 string ) row format delimited fields terminated by '\t' stored as textfile; load data local inpath '/home/jiangzl/shell/test.txt' into table tmp_jiangzl_test;
2.處理
select col1,col2,concat_ws(',',collect_set(col3)) from tmp_jiangzl_test group by col1,col2;
二、列轉行
1、問題
hive如何將
a b 1,2,3
c d 4,5,6
變為:
a b 1
a b 2
a b 3
c d 4
c d 5
c d 6
2、答案
1.建表
drop table tmp_jiangzl_test; create table tmp_jiangzl_test ( col1 string, col2 string, col3 string ) row format delimited fields terminated by '\t' stored as textfile;
處理:
select col1, col2, col5 from tmp_jiangzl_test a lateral view explode(split(col3,',')) b AS col5
hive中的concat,concat_ws,collect_set 用法:
collect_set的作用:collect_set(col)函數只接受基本數據類型,它的主要作用是將某字段的值進行去重匯總,產生array類型字段。
concat_ws的作用:表示concat with separator,即有分隔符的字符串連接,concat_ws(”,collect_set(home_location))表示用空的字符”來連接collect_set返回的array中的每個元素。
concat:可以連接一個或者多個字符串,select concat(‘11’,’22’,’33’);//112233
原文:https://blog.csdn.net/chaoshengmingyue/article/details/82020667
本文轉自:https://blog.csdn.net/buster2014/article/details/50461654