Hive-分組之后取前n個


1. 統計國家每個省份出現次數最高的5個城市的名稱

直觀思維來考慮:

把 數據組織成:

國家     省份     出現次數(倒序)  城市

row_number() 根據partition by 生成次序 ,rank_code, 然后用rank_code 做限制  

2. sql 程序

select

country_name,

province_name,

city_name,

cnt_num,

row_number() over (partition by country_name, province order by cnt_num desc) rank_code

from table

where rank_code <= 5

 3. 參考文章鏈接

https://blog.csdn.net/mori66/article/details/54670204

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM