問題:
有一個表(表名:book,兩個字段:id,desc)
id desc
001 書名: 追風箏的人, ISBN編號: 9787208061644, 作者: 卡勒德.胡賽尼
002 書名: 秘密花園, ISBN編號: 9787550252585, 作者: 喬漢娜·貝斯福
需求:
其中desc字段包含了幾個參數信息,需把它拆分開來,一行一個參數,結果如下
001 書名: 追風箏的人
001 ISBN編號: 9787208061644
001 作者: 卡勒德.胡賽尼
002 書名: 秘密花園
002 ISBN編號: 9787550252585
002 作者: 喬漢娜·貝斯福
解決辦法:
select id,sp from book a lateral view explode(split(a.desc,',')) t as sp where 1=1;
id sp
001 書名: 追風箏的人
001 ISBN編號: 9787208061644
....
其中sp是拆出來的字段的,結果和需求一樣。
非常簡練,雖然hive有不能insert,update的缺點,但很多sql語法都支持,不失為大數據分析的一個好工具!