Oracle去重復,作用於多列


 1 用distinct關鍵字只能過濾查詢字段中所有記錄相同的(記錄集相同),而如果要指定一個字段卻沒有效果,另外distinct關鍵字會排序,效率很低 。 
 2 select distinct name from t1 能消除重復記錄,但只能取一個字段,現在要同時取id,name這2個字段的值。 
 3 select distinct id,name from t1 可以取多個字段,但只能消除這2個字段值全部相同的記錄 
 4 所以用distinct達不到想要的效果,用group by 可以解決這個問題。 
 5 例如要顯示的字段為A、B、C三個,而A字段的內容不能重復可以用下面的語句: 
 6 select A, min(B),min(C),count(*) from [table] where [條件] group by A 
 7 having [條件] order by A desc 
 8 為了顯示標題頭好看點可以把select A, min(B),min(C),count(*) 換稱select A as A, min(B) as B,min(C) as C,count(*) as 重復次數 
 9 顯示出來的字段和排序字段都要包括在group by 中 
10 但顯示出來的字段包有min,max,count,avg,sum等聚合函數時可以不在group by 中 
11 如上句的min(B),min(C),count(*) 
12 一般條件寫在where 后面 
13 有聚合函數的條件寫在having 后面 
14 如果在上句中having加 count(*)>1 就可以查出記錄A的重復次數大於1的記錄 
15 如果在上句中having加 count(*)>2 就可以查出記錄A的重復次數大於2的記錄 
16 如果在上句中having加 count(*)>=1 就可以查出所有的記錄,但重復的只顯示一條,並且后面有顯示重復的次數----這就是所需要的結果,而且語句可以通過hibernate 
17 下面語句可以查詢出那些數據是重復的: 
18 select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1 
19 將上面的>號改為=號就可以查詢出沒有重復的數據了。 
20 例如 
21 復制代碼代碼如下:
22 
23 select count(*) from (select gcmc,gkrq,count(*) from gczbxx_zhao t group by gcmc,gkrq having 
24 count(*)>=1 order by GKRQ) 
25 select * from gczbxx_zhao where viewid in ( select max(viewid) from gczbxx_zhao group by 
26 gcmc ) order by gkrq desc ---還是這個可行 
27 28 有一面試題說:distinct去重復的效率很底下,我在網上看到這遍文章的方法好像說是用 group by having 效率很高了? 
29 我在了一個測試,有一商品表,26萬條記錄,只有商品編號建了索引,對品牌名稱字段做 distinct 
30 復制代碼代碼如下:
31 
32 select brand,count(*) from tab_commbaseinfo group by brand having count(*) =1 
33 
34 平均時間是:0.453 
35 復制代碼代碼如下:
36 
37 select distinct brand from tab_commbaseinfo 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM