sql 單表distinct/多表group by查詢去除重復記錄


單表distinct

多表group by

group by 必須放在 order by 和 limit之前,不然會報錯

 

(下轉)

在使用mysql時,有時需要查詢出某個字段不重復的記錄,雖然mysql提供有distinct這個關鍵字來過濾掉多余的重復記錄只保留一條,但往往只用它來返回不重復記錄的條數,而不是用它來返回不重記錄的所有值。其原因是distinct只能返回它的目標字段,而無法返回其它字段,這個問題讓我困擾了很久,用distinct不能解決的話,我只有用二重循環查詢來解決,而這樣對於一個數據量非常大的站來說,無疑是會直接影響到效率的。所以我花了很多時間來研究這個問題,網上也查不到解決方案,期間把容容拉來幫忙,結果是我們兩人都郁悶了。。。。。。。。。

下面先來看看例子:

    table
   id name
   1 a
   2 b
   3 c
   4 c
   5 b

庫結構大概這樣,這只是一個簡單的例子,實際情況會復雜得多。

比如我想用一條語句查詢得到name不重復的所有數據,那就必須使用distinct去掉多余的重復記錄。

select distinct name from table
得到的結果是:

  name
   a
   b
   c

好像達到效果了,可是,我想要得到的是id值呢?改一下查詢語句吧:

select distinct name, id from table

結果會是:

  id name
   1 a
   2 b
   3 c
   4 c
   5 b

distinct怎么沒起作用?作用是起了的,不過他同時作用了兩個字段,也就是必須得id與name都相同的才會被排除。。。。。。。

我們再改改查詢語句:

select id, distinct name from table

很遺憾,除了錯誤信息你什么也得不到,distinct必須放在開頭。難到不能把distinct放到where條件里?能,照樣報錯。。。。。。。

很麻煩吧?確實,費盡心思都沒能解決這個問題。沒辦法,繼續找人問。

拉住公司里一JAVA程序員,他給我演示了oracle里使用distinct之后,也沒找到mysql里的解決方案,最后下班之前他建議我試試group by。

試了半天,也不行,最后在mysql手冊里找到一個用法,用group_concat(distinct name)配合group by name實現了我所需要的功能,興奮,天佑我也,趕快試試。

報錯。。。。。。。。。。。。郁悶。。。。。。。連mysql手冊也跟我過不去,先給了我希望,然后又把我推向失望,好狠哪。。。。

再仔細一查,group_concat函數是4.1支持,暈,我4.0的。沒辦法,升級,升完級一試,成功。。。。。。

終於搞定了,不過這樣一來,又必須要求客戶也升級了。

突然靈機一閃,既然可以使用group_concat函數,那其它函數能行嗎?

趕緊用count函數一試,成功,我。。。。。。。想哭啊,費了這么多工夫。。。。。。。。原來就這么簡單。。。。。。

現在將完整語句放出:

select *, count(distinct name) from table group by name

結果:

  id name count(distinct name)
   1 a 1
   2 b 1
   3 c 1

最后一項是多余的,不用管就行了,目的達到。。。。。

唉,原來mysql這么笨,輕輕一下就把他騙過去了,郁悶也就我吧(對了,還有容容那家伙),現在拿出來希望大家不要被這問題折騰。

哦,對,再順便說一句,group by 必須放在 order by 和 limit之前,不然會報錯。。。。。。。。!OK了


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM