Oracle單表去重復(二)


Oracle單表去重

去重有兩層含義,一:是記錄完全一樣。二:是符合一定條件的認為是重復。
根據表的數量,去重可划分為:單表去重和多表關聯去重。
 
對於去重,一般最容易想到的是用distinct,而distinct只能對記錄 完全重復的記錄保留一條。
distinct使用的是二重循環的方式來去重的,如果數據量非常大的時候,會導致性能急劇下降。
我們前一篇文章已經給出了詳解,你可以去查看  Oracle單表去重復(一)  
 
下面是一個單表去重的測試,認為name字段相同的即為重復記錄,要查詢出一個結果,過濾掉重復,distinct顯然不能滿足要求。
 
表SQL:
create  table A_TEST    
(    
        id                 number,    
         name         varchar2(20),    
        remark varchar2(20)    
);    

insert  into A_TEST (ID,  NAME, REMARK)    
values (1,  'a''ss');    

insert  into A_TEST (ID,  NAME, REMARK)    
values (2,  'b''xxx');    

insert  into A_TEST (ID,  NAME, REMARK)    
values (3,  'b''x');    

insert  into A_TEST (ID,  NAME, REMARK)    
values (4,  'b''asd');    

insert  into A_TEST (ID,  NAME, REMARK)    
values (5,  'c''axxx');    

insert  into A_TEST (ID,  NAME, REMARK)    
values (6,  'c''asdf');    
 
 
去重方式一(低效):
select a.*    
         from A_TEST a, ( select  min(id)  as id  from A_TEST t  group  by  name) b    
where a.id = b.id;
 
去重方式一(高效):
select *    
         from ( select a.*, rownum row_num  from A_TEST a) x    
where x.row_num  in ( select  min(rownum)  from A_TEST t  group  by  name)
 
可見,使用rownum的效率比使用id的效率要高,當表數據量很大的時候,差距會很明顯。

出處:http://lavasoft.blog.51cto.com/62575/368087


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM