hive sql 窗口函數


1) 窗口函數 Lag, Lead, First_value,Last_value

Lag, Lead、這兩個函數為常用的窗口函數,可以返回上下數據行的數據.

LAG(col,n,DEFAULT) 用於統計窗口內往上第n行值

LEAD(col,n,DEFAULT) 用於統計窗口內往下第n行值, 與LAG相反

-- 組內排序后,向后或向前偏移
-- 如果省略掉第三個參數,默認為NULL,否則補上。

select
    dp_id,
    mt,
    payment,
    LAG(mt,2) over(partition by dp_id order by mt) mt_new
from test2;

結果如圖:



-- 組內排序后,向后或向前偏移
-- 如果省略掉第三個參數,默認為NULL,否則補上。

select
   dp_id,
   mt,
   payment,
   LEAD(mt,2,'1111-11') over(partition by dp_id order by mt) mt_new
from test2;

結果如圖:



FIRST_VALUE, LAST_VALUE

first_value:  取分組內排序后,截止到當前行,第一個值

last_value:  取分組內排序后,截止到當前行,最后一個值

-- FIRST_VALUE      獲得組內當前行往前的首個值
-- LAST_VALUE       獲得組內當前行往前的最后一個值
-- FIRST_VALUE(DESC) 獲得組內全局的最后一個值

select
   dp_id,
   mt,
   payment,
   FIRST_VALUE(payment) over(partition by dp_id order by mt) payment_g_first,
   LAST_VALUE(payment) over(partition by dp_id order by mt) payment_g_last,
  FIRST_VALUE(payment) over(partition by dp_id order by mt desc) payment_g_last_global
from test2
ORDER BY dp_id,mt;



2)排名函數 Rank,Dense_Rank, Row_Number

R()  over  (partion  by  col1...  order  by  col2...  desc/asc)

select
   class1,
   score,
   rank() over(partition by class1 order by score desc) rk1,
   dense_rank() over(partition by class1 order by score desc) rk2,
   row_number() over(partition by class1 order by score desc) rk3
from zyy_test1;



如上圖所示,rank  會對相同數值,輸出相同的序號,而且下一個序號不間斷;

       dense_rank  會對相同數值,輸出相同的序號,但下一個序號,間斷


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM