hive 中實現分組排序(去重操作)


最近遇到一個需求:求出各個部分工資排名前十的同事。由於數據量太大,在、不能只能用mysql(速度太慢了),還就用hive進行查詢。

找到了一個分組排序函數 row_number()

 

語法: row_number() over(partition by 分組列 order by 排序列 desc)

 

注意:在使用 row_number() over()函數時候,over()里頭的分組以及排序的執行晚於 where 、group by、  order by 的執行。

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM