Oracle單表去重
去重有兩層含義,一:是記錄完全一樣。二:是符合一定條件的認為是重復。
根據表的數量,去重可划分為:單表去重和多表關聯去重。
對於去重,一般最容易想到的是用distinct,而distinct只能對記錄
完全重復的記錄保留一條。
distinct使用的是二重循環的方式來去重的,如果數據量非常大的時候,會導致性能急劇下降。
我們前一篇文章已經給出了詳解,你可以去查看
Oracle單表去重復(一)
下面是一個單表去重的測試,認為name字段相同的即為重復記錄,要查詢出一個結果,過濾掉重復,distinct顯然不能滿足要求。
表SQL:
create
table A_TEST
(
id number,
name varchar2(20),
remark varchar2(20)
);
insert into A_TEST (ID, NAME, REMARK)
values (1, 'a', 'ss');
insert into A_TEST (ID, NAME, REMARK)
values (2, 'b', 'xxx');
insert into A_TEST (ID, NAME, REMARK)
values (3, 'b', 'x');
insert into A_TEST (ID, NAME, REMARK)
values (4, 'b', 'asd');
insert into A_TEST (ID, NAME, REMARK)
values (5, 'c', 'axxx');
insert into A_TEST (ID, NAME, REMARK)
values (6, 'c', 'asdf');
(
id number,
name varchar2(20),
remark varchar2(20)
);
insert into A_TEST (ID, NAME, REMARK)
values (1, 'a', 'ss');
insert into A_TEST (ID, NAME, REMARK)
values (2, 'b', 'xxx');
insert into A_TEST (ID, NAME, REMARK)
values (3, 'b', 'x');
insert into A_TEST (ID, NAME, REMARK)
values (4, 'b', 'asd');
insert into A_TEST (ID, NAME, REMARK)
values (5, 'c', 'axxx');
insert into A_TEST (ID, NAME, REMARK)
values (6, 'c', 'asdf');
去重方式一(低效):
select a.*
from A_TEST a, ( select min(id) as id from A_TEST t group by name) b
where a.id = b.id;
from A_TEST a, ( select min(id) as id from A_TEST t group by name) b
where a.id = b.id;

去重方式一(高效):
select *
from ( select a.*, rownum row_num from A_TEST a) x
where x.row_num in ( select min(rownum) from A_TEST t group by name)
from ( select a.*, rownum row_num from A_TEST a) x
where x.row_num in ( select min(rownum) from A_TEST t group by name)

可見,使用rownum的效率比使用id的效率要高,當表數據量很大的時候,差距會很明顯。