本事例實驗用表task,結構如下
MySQL> desc task;
+-------------+------------+------+-----+-------------------+-------+
| Field | Type | Null | Key | Default | Extra |
+-------------+------------+------+-----+-------------------+-------+
| PLAYER_ID | bigint(20) | NO | PRI | NULL | |
| TASK_ID | int(11) | NO | PRI | NULL | |
| TASK_STATUS | tinyint(4) |NO | | NULL | |
| CREATE_DATE | datetime | YES | | NULL | |
| UPDATE_DATE |timestamp | NO | | CURRENT_TIMESTAMP | |
+-------------+------------+------+-----+-------------------+-------+
1 Distinct 位置
單獨的distinct只能放在開頭,否則報錯,語法錯誤
mysql> Select player_id,distinct(task_id) from task;
ERROR 1064 (42000): You havean error in your SQL syntax; check the manual that
corresponds to your MySQLserver version for the right syntax to use near 'disti
nct(task_id) from task' atline 1
現在把distinct放在開頭
mysql> Select distinct(task_id),taskid from task;
查詢成功
與其他函數使用時候,沒有位置限制如下
Select player_id,count(distinct(task_id))from task;
這種情況下是正確的,可以使用。
2 Distinct用法
a.在count計算不重復的記錄的時候能用到
比如SELECT COUNT( DISTINCT player_id ) FROM task;
就是計算talbebname表中id不同的記錄有多少條
b,在需要返回記錄不同的id的具體值的時候可以用
比如SELECT DISTINCT player_id FROM task;
返回talbebname表中不同的id的具體的值
c.上面的情況2對於需要返回mysql表中2列以上的結果時會有歧義
比如SELECT DISTINCT player_id, task_id FROM task;
實際上返回的是player_id與task_id同時不相同的結果,也就是DISTINCT同時作用了兩個字段,必須得player_id與task_id都相同的才被排除了,與我們期望的結果不一樣,我們期望的是player_id不同被過濾
在這種情況下,distinct同時作用了兩個字段,player_id,task_id
d.這時候可以考慮使用group_concat函數來進行排除,不過這個mysql函數是在mysql4.1以上才支持的
e. 其實還有另外一種解決方式,就是使用
SELECT player_id, task_id, count(DISTINCT player_id) FROM task.
雖然這樣的返回結果多了一列無用的count數據(有時也許就需要這個數據)
f 同時我們還可以利用下面的方式解決b遇到的歧義問題通過group by 分組
select player_id,task_id from task group by player_id
distinct 優化
請參考:http://isky000.com/database/mysql_distinct_implement
對distinct的原理 及優化分析的很好,大家可以查看。