Oracle去除重復(某一列的值重復),取最新(日期字段最新)的一條數據


轉自 : http://blog.csdn.net/nux_123/article/details/45037719

 

問題:在項目中有一張設備檢測信息表DEVICE_INFO_TBL, 每個設備每天都會產生一條檢測信息,現在需要從該表中檢索出每個設備的最新檢測信息。也就是device_id字段不能重復,消除device_id字段重復的記錄,而且device_id對應的檢測信息test_result是最新的。

 

解決思路:用Oracle的row_number() over函數來解決該問題。

開窗函數          
     Oracle從8.1.6開始提供分析函數,分析函數用於計算基於組的某種聚合值,它和聚合函數的不同之處是:對於每個組返回多行,而聚合函數對於每個組只返回一行。

      開窗函數指定了分析函數工作的數據窗口大小,這個數據窗口大小可能會隨着行的變化而變化,舉例如下:
1:over后的寫法:    
   over(order by salary) 按照salary排序進行累計,order by是個默認的開窗函數
   over(partition by deptno)按照部門分區

 

   over(partition by deptno order by salary)

 

2:開窗的窗口范圍:
over(order by salary range between 5 preceding and 5 following):窗口范圍為當前行數據幅度減5加5后的范圍內的。

舉例:

 

--sum(s)over(order by s range between 2 preceding and 2 following) 表示加2或2的范圍內的求和

 select name,class,s, sum(s)over(order by s range between 2 preceding and 2 following) mm from t2
adf        3        45        45  --45加2減2即43到47,但是s在這個范圍內只有45
asdf       3        55        55
cfe        2        74        74
3dd        3        78        158 --78在76到80范圍內有78,80,求和得158
fda        1        80        158
gds        2        92        92
ffd        1        95        190
dss        1        95        190
ddd        3        99        198

gf         3        99        198

 

 

 

over(order by salary rows between 5 preceding and 5 following):窗口范圍為當前行前后各移動5行。

舉例:

 

--sum(s)over(order by s rows between 2 preceding and 2 following)表示在上下兩行之間的范圍內
select name,class,s, sum(s)over(order by s rows between 2 preceding and 2 following) mm from t2
adf        3        45        174  (45+55+74=174)
asdf       3        55        252   (45+55+74+78=252)
cfe        2        74        332    (74+55+45+78+80=332)
3dd        3        78        379    (78+74+55+80+92=379)
fda        1        80        419
gds        2        92        440
ffd        1        95        461
dss        1        95        480
ddd        3        99        388
gf         3        99        293
over(order by salary range between unbounded preceding and unbounded following)或者
over(order by salary rows between unbounded preceding and unbounded following):窗口不做限制

解決過程:

 1.查看表中的重復記錄

select
    t.id,
    t.device_id,
    t.update_dtm,
    t.test_result
from DEVICE_INFO_TBL t
查看重復數據
 
2.標記重復的記錄
select
    t.id,
    t.device_id,
    t.update_dtm,
    t.test_result,
    row_number() OVER(PARTITION BY device_id ORDER BY t.update_dtm desc) as row_flg   
from DEVICE_INFO_TBL t
標記重復記錄
 
3.過濾重復數據,取得最新的記錄
select
    temp.id,
    temp.device_id,
    temp.update_dtm,
    temp.test_result
from (
         select
             t.id,
             t.device_id,
             t.update_dtm,
             t.test_result,
             row_number() OVER(PARTITION BY device_id ORDER BY t.update_dtm desc) as row_flg   
          from DEVICE_INFO_TBL t ) temp
where temp.row_flg  = '1'
過濾重復數據






row_number() OVER (PARTITION BY COL1 ORDER BY COL2) 表示根據COL1分組,在分組內部根據 COL2排序,而此函數計算的值就表示每組內部排序后的順序編號(組內連續的唯一的).

  與rownum的區別在於:使用rownum進行排序的時候是先對結果集加入偽列rownum然后再進行排序,而此函數在包含排序從句后是先排序再計算行號碼.

  row_number()和rownum差不多,功能更強一點(可以在各個分組內從1開時排序).

  rank()是跳躍排序,有兩個第二名時接下來就是第四名(同樣是在各個分組內).

  dense_rank()l是連續排序,有兩個第二名時仍然跟着第三名。相比之下row_number是沒有重復值的 .

  lag(arg1,arg2,arg3):
arg1是從其他行返回的表達式
arg2是希望檢索的當前行分區的偏移量。是一個正的偏移量,時一個往回檢索以前的行的數目。
arg3是在arg2表示的數目超出了分組的范圍時返回的值。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM