sql 查詢 某字段 重復次數 最多的記錄


需求  查詢小時氣象表中 同一日期、同一城市、同意檢測站點  首要污染物出現次數最多的記錄

第一步: 添加 排序字段

        select StationID,RecordDate,CityID,Primary_Pollutant,ROW_NUMBER() over(partition by StationID,RecordDate,CityID order by count(0) desc ) as Numfrom  T_AirHourly 

        group by StationID,RecordDate,CityID,Primary_Pollutant 

第二步  子查詢:在查詢的基礎上再次查詢

     select StationID,RecordDate,CityID,Primary_Pollutant from (

        select StationID,RecordDate,CityID,Primary_Pollutant,ROW_NUMBER() over(partition by StationID,RecordDate,CityID order by count(0) desc ) as Numfrom  T_AirHourly 

        group by StationID,RecordDate,CityID,Primary_Pollutant 

)t where t.Num = 1

第三步 創建視圖

 create view V_Primary_Pollutant as

     select StationID,RecordDate,CityID,Primary_Pollutant from (

        select StationID,RecordDate,CityID,Primary_Pollutant,ROW_NUMBER() over(partition by StationID,RecordDate,CityID order by count(0) desc ) as Numfrom  T_AirHourly 

        group by StationID,RecordDate,CityID,Primary_Pollutant 

)t where t.Num = 1

 結果:

 

第五步: 統計一天中各種污染物的平均值 

將視圖作為獨立模塊  左連接查詢  統計一天 各種污染物的平均值。

 

 

 轉載:

row_ number over函數的基本用法

https://xiaoxiaoher.iteye.com/blog/2428619

函數語法: ROW_NUMBER() OVER(PARTITION BY COLUMN ORDER BY COLUMN)

函數作用:從1開始,為按組排序的每條記錄添加一個序列號  函數只能用於select和order by子句中 不能用在where子句

 

不分組排序

不進行分組時語法為ROW_NUMBER() OVER(ORDER BY COLUMN),如:

有一個表A就一個字段num,數據如下

num

10

20

30

查詢語句為select row_number() over(order by num) as idx,num from A

結果如下

num      idx

10          1

20          2

30          3

 

分組排序

分組的話ROW_NUMBER() OVER(PARTITION BY COL1 ORDER BY COL2)表示根據COL1分組,在分組內部根據COL2排序,

而此函數的結果值就表示每組內部排序后的順序編號(組內連續的惟一的)

表employee有數據如下

empid        deptid            salary

1               10                   5500.00

2               10                   4500.00

3                20                  1900.00

4               20                   4800.00

查詢語句為:select *,row_number() over(partition by deptid order by salary desc) rank from employee

結果如下

empid        deptid             salary            rank

1                10                   5500.00        1

2                 10                  4500.00         2

4                 20                  4800.00         1

3                 20                  1900.00         2

 

比較

可以看到這個函數不分組時的作用oracle自帶row_num也能完成,差別就是row_num從0開始。分組排序這個功能就比較強大

另外還有兩個類似函數rank() over() 和dense_rank() over()

區別就是如果排序字段有重復值

row_number()函數還是1 2 3排下去

rank() over()則會出現 1  1  3

dense_rank() over() 則會出現 1 1 2

這三種情況 就是給的序號不一樣

 

ROW_NUMBER() OVER()函數用法;(分組,排序),partition by

 

轉載:https://www.cnblogs.com/alsf/p/6344197.html

 http://www.cnblogs.com/BluceLee/p/8004716.html

1、row_number() over()排序功能:

(1) row_number() over()分組排序功能:

     在使用 row_number() over()函數時候,over()里頭的分組以及排序的執行晚於 where group by  order by 的執行。

partition by 用於給結果集分組,如果沒有指定那么它把整個結果集作為一個分組,它和聚合函數不同的地方在於它能夠返回一個分組中的多條記錄,而聚合函數一般只有一個反映統計值的記錄。

例如:employee,根據部門分組排序。

復制代碼
復制代碼
SELECT empno,WORKDEPT,SALARY, Row_Number() OVER (partition by workdept ORDER BY salary desc) rank FROM employee   
--------------------------------------  
000010  A00 152750  1  
000110  A00 66500   2  
000120  A00 49250   3  
200010  A00 46500   4  
200120  A00 39250   5  
000020  B01 94250   1  
000030  C01 98250   1  
000130  C01 73800   2  
復制代碼
復制代碼

(2)對查詢結果進行排序:(無分組)

復制代碼
復制代碼
SELECT empno,WORKDEPT,SALARY, Row_Number() OVER (ORDER BY salary desc) rank FROM employee   
--------------------------------------  
000010  A00 152750  1  
000030  C01 98250   2  
000070  D21 96170   3  
000020  B01 94250   4  
000090  E11 89750   5  
000100  E21 86150   6  
000050  E01 80175   7  
000130  C01 73800   8  
000060  D11 72250   9  
復制代碼
復制代碼

row_number() over()和rownum差不多,功能更強一點(可以在各個分組內從1開時排序).

 

2、rank() over()是跳躍排序,有兩個第二名時接下來就是第四名(同樣是在各個分組內).

復制代碼
復制代碼
select workdept,salary,rank() over(partition by workdept order by salary) as dense_rank_order from emp order by workdept;  
------------------  
A00 39250   1  
A00 46500   2  
A00 49250   3  
A00 66500   4  
A00 152750  5  
B01 94250   1  
C01 68420   1  
C01 68420   1  
C01 73800   3  
復制代碼
復制代碼

3、dense_rank() over()是連續排序,有兩個第二名時仍然跟着第三名。相比之下row_number是沒有重復值的 .

復制代碼
復制代碼
select workdept,salary,dense_rank() over(partition by workdept order by salary) as dense_rank_order from emp order by workdept;  
------------------  
A00 39250   1  
A00 46500   2  
A00 49250   3  
A00 66500   4  
A00 152750  5  
B01 94250   1  
C01 68420   1  
C01 68420   1  
C01 73800   2  
C01 98250   3  
復制代碼
復制代碼

使用ROW_NUMBER刪除重復數據 
---假設表TAB中有a,b,c三列,可以使用下列語句刪除a,b,c都相同的重復行。

DELETE FROM (select year,QUARTER,RESULTS,row_number() over(partition by YEAR,QUARTER,RESULTS order by YEAR,QUARTER,RESULTS) AS ROW_NO FROM SALE )   
WHERE ROW_NO>1  

 

 

 

 

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM