在hive中會有很多數據是用json格式來存儲的,而我們用數據的時候又必須要將json格式的數據解析成為正常的數據,今天我們就來聊聊hive中是如何解析json數據的。
下面這張表就是json格式的表,我們以這張表為例來解析json
select * from ff_sa.sa06_ff_b1_session_olg where etl_tx_dt = 20190617
查詢結果:
取字段:(重點來了!!!)
1.取單個json字段:
get_json_object(STRING json_string, STRING path)
select get_json_object(key,'$.uuid') from ff_sa.sa06_ff_b1_session_olg where etl_tx_dt =20190617
結果:
注意:如果字段名稱錯誤,不會報錯,但結果會是null
select get_json_object(key,'$.uuid1') from ff_sa.sa06_ff_b1_session_olg where etl_tx_dt =20190617
2.同時取多個字段
select get_json_object(key,'$.uuid'),get_json_object(key,'$.appName') from ff_sa.sa06_ff_b1_session_olg where etl_tx_dt =20190617
結果:
是不是覺得這種取多個字段的方法比較low,來看取多個字段的另一種方法:
json_tuple(STRING jsonStr, STRING k1, STRING k2)
select json_tuple(key,'uuid','appName') from ff_sa.sa06_ff_b1_session_olg where etl_tx_dt =20190617
結果:
注意:這里已經沒有$.了,再來看下如果不去掉的結果:
select json_tuple(key,'$.uuid','$.appName') from ff_sa.sa06_ff_b1_session_olg where etl_tx_dt =20190617
結果: