sql distinct詳解以及優化


一.distinct簡介

distinct這個關鍵字來過濾掉多余的重復記錄只保留一條,但往往只用 它來返回不重復記錄的條數,而不是用它來返回不重記錄的所有值。其原因是distinct只有用二重循環查詢來解決,而這樣對於一個數據量非常大的站來說,無疑是會直接影響到效率的。

下面先來看看例子:

table表

字段1     字段2
   id        name
   1           a
   2           b
   3           c
   4           c
   5           b

庫結構大概這樣,這只是一個簡單的例子,實際情況會復雜得多。

比如我想用一條語句查詢得到name不重復的所有數據,那就必須使用distinct去掉多余的重復記錄。

select distinct name from table
得到的結果是:

 ----------

name
   a
   b
   c

好像達到效果了,可是,我想要得到的是id值呢?改一下查詢語句吧:

select distinct name, id from table

結果會是:

----------

id name
   1 a
   2 b
   3 c
   4 c
   5 b

distinct怎么沒起作用?作用是起了的,不過他同時作用了兩個字段,也就是必須得id與name都相同的才會被排除。。。。。。。

我們再改改查詢語句:

select id, distinct name from table

很遺憾,除了錯誤信息你什么也得不到,distinct必須放在開頭。難到不能把distinct放到where條件里?能,照樣報錯。

下面方法可行:

select *, count(distinct name) from table group by name

結果:

   id name count(distinct name)
   1 a 1
   2 b 1
   3 c 1

最后一項是多余的,不用管就行了,目的達到。。。。。

group by 必須放在 order by 和 limit之前,不然會報錯

==============以上是關於Oracle的distinct的一種用法==============

用distinct關鍵字只能過濾查詢字段中所有記錄相同的(記錄集相同),而如果要指定一個字段卻沒有效果,另外distinct關鍵字會排序,效率很低。

select distinct name from t1 能消除重復記錄,但只能取一個字段,現在要同時取id,name這2個字段的值。
select distinct id,name from t1 可以取多個字段,但只能消除這2個字段值全部相同的記錄
所以用distinct達不到想要的效果,用group by   可以解決這個問題。 

二. distinct使用

 

1  Distinct 位置

 

  單獨的distinct只能放在開頭,否則報錯,語法錯誤

mysql> Select  player_id,distinct(task_id) from task;

ERROR 1064 (42000): You havean error in your SQL syntax; check the manual that

corresponds to your MySQLserver version for the right syntax to use near 'disti

nct(task_id) from task' atline 1

現在把distinct放在開頭

mysql> Select  distinct(task_id),taskid from task;

查詢成功

與其他函數使用時候,沒有位置限制如下

  Select player_id,count(distinct(task_id))from task;

這種情況下是正確的,可以使用。

2  Distinct用法

a.在count計算不重復的記錄的時候能用到
比如SELECT COUNT( DISTINCT player_id ) FROM task;
就是計算talbebname表中id不同的記錄有多少條

b,在需要返回記錄不同的id的具體值的時候可以用
比如SELECT DISTINCT player_id FROM task;
返回talbebname表中不同的id的具體的值

c.上面的情況2對於需要返回mysql表中2列以上的結果時會有歧義
比如SELECT DISTINCT player_id, task_id FROM task;
實際上返回的是player_id與task_id同時不相同的結果,也就是DISTINCT同時作用了兩個字段,必須得player_id與task_id都相同的才被排除了,與我們期望的結果不一樣,我們期望的是player_id不同被過濾

  在這種情況下,distinct同時作用了兩個字段,player_id,task_id

d.這時候可以考慮使用group_concat函數來進行排除,不過這個mysql函數是在mysql4.1以上才支持的

e. 其實還有另外一種解決方式,就是使用
SELECT player_id, task_id, count(DISTINCT player_id) FROM task.
雖然這樣的返回結果多了一列無用的count數據(有時也許就需要這個數據)

f 同時我們還可以利用下面的方式解決b遇到的歧義問題通過group by 分組

  select player_id,task_id from task group by player_id


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM