mysql單列去重復group by分組取每組前幾條記錄加order by排序


mysql單列去重復group by分組取每組前幾條記錄加order by排序

mysql分組取每組前幾條記錄(排名) 附group by與order by的研究,需要的朋友可以參考下

--按某一字段分組取最大(小)值所在行的數據 

復制代碼代碼如下:


/* 
數據如下: 
name val memo 
a 2 a2(a的第二個值) 
a 1 a1--a的第一個值 
a 3 a3:a的第三個值 
b 1 b1--b的第一個值 
b 3 b3:b的第三個值 
b 2 b2b2b2b2 
b 4 b4b4 
b 5 b5b5b5b5b5 
*/ 


--創建表並插入數據: 

復制代碼代碼如下:


create table tb(name varchar(10),val int,memo varchar(20)) 
insert into tb values('a', 2, 'a2(a的第二個值)') 
insert into tb values('a', 1, 'a1--a的第一個值') 
insert into tb values('a', 3, 'a3:a的第三個值') 
insert into tb values('b', 1, 'b1--b的第一個值') 
insert into tb values('b', 3, 'b3:b的第三個值') 
insert into tb values('b', 2, 'b2b2b2b2') 
insert into tb values('b', 4, 'b4b4') 
insert into tb values('b', 5, 'b5b5b5b5b5') 
go 


--一、按name分組取val最大的值所在行的數據。 

復制代碼代碼如下:


--方法1:select a.* from tb a where val = (select max(val) from tb where name = a.name) order by a.name 
--方法2: 
select a.* from tb a where not exists(select 1 from tb where name = a.name and val > a.val) 
--方法3: 
select a.* from tb a,(select name,max(val) val from tb group by name) b where a.name = b.name and a.val = b.val order by a.name 
--方法4: 
select a.* from tb a inner join (select name , max(val) val from tb group by name) b on a.name = b.name and a.val = b.val order by a.name 
--方法5 
select a.* from tb a where 1 > (select count(*) from tb where name = a.name and val > a.val ) order by a.name 
/* 
name val memo 
---------- ----------- -------------------- 
a 3 a3:a的第三個值 
b 5 b5b5b5b5b5 
*/ 


本人推薦使用1,3,4,結果顯示1,3,4效率相同,2,5效率差些,不過我3,4效率相同毫無疑問,1就不一樣了,想不搞了。 
--二、按name分組取val最小的值所在行的數據。 

復制代碼代碼如下:


--方法1:select a.* from tb a where val = (select min(val) from tb where name = a.name) order by a.name 
--方法2: 
select a.* from tb a where not exists(select 1 from tb where name = a.name and val < a.val) 
--方法3: 
select a.* from tb a,(select name,min(val) val from tb group by name) b where a.name = b.name and a.val = b.val order by a.name 
--方法4: 
select a.* from tb a inner join (select name , min(val) val from tb group by name) b on a.name = b.name and a.val = b.val order by a.name 
--方法5 
select a.* from tb a where 1 > (select count(*) from tb where name = a.name and val < a.val) order by a.name 
/* 
name val memo 
---------- ----------- -------------------- 
a 1 a1--a的第一個值 
b 1 b1--b的第一個值 
*/ 


--三、按name分組取第一次出現的行所在的數據。 

復制代碼代碼如下:


select a.* from tb a where val = (select top 1 val from tb where name = a.name) order by a.name 
/* 
name val memo 
---------- ----------- -------------------- 
a 2 a2(a的第二個值) 
b 1 b1--b的第一個值 
*/ 


--四、按name分組隨機取一條數據。 

復制代碼代碼如下:


select a.* from tb a where val = (select top 1 val from tb where name = a.name order by newid()) order by a.name/* 
name val memo 
---------- ----------- -------------------- 
a 1 a1--a的第一個值 
b 5 b5b5b5b5b5 
*/ 


--五、按name分組取最小的兩個(N個)val 

復制代碼代碼如下:


select a.* from tb a where 2 > (select count(*) from tb where name = a.name and val < a.val ) order by a.name,a.valselect a.* from tb a where val in (select top 2 val from tb where name=a.name order by val) order by a.name,a.val 
select a.* from tb a where exists (select count(*) from tb where name = a.name and val < a.val having Count(*) < 2) order by a.name 
/* 
name val memo 
---------- ----------- -------------------- 
a 1 a1--a的第一個值 
a 2 a2(a的第二個值) 
b 1 b1--b的第一個值 
b 2 b2b2b2b2 
*/ 


--六、按name分組取最大的兩個(N個)val 

復制代碼代碼如下:


select a.* from tb a where 2 > (select count(*) from tb where name = a.name and val > a.val ) order by a.name,a.val 
select a.* from tb a where val in (select top 2 val from tb where name=a.name order by val desc) order by a.name,a.val 
select a.* from tb a where exists (select count(*) from tb where name = a.name and val > a.val having Count(*) < 2) order by a.name 
/* 
name val memo 
---------- ----------- -------------------- 
a 2 a2(a的第二個值) 
a 3 a3:a的第三個值 
b 4 b4b4 
b 5 b5b5b5b5b5 
*/ 


--七,假如整行數據有重復,所有的列都相同(例如下表中的第5,6兩行數據完全相同)。 
按name分組取最大的兩個(N個)val 

復制代碼代碼如下:


/* 
數據如下: 
name val memo 
a 2 a2(a的第二個值) 
a 1 a1--a的第一個值 
a 1 a1--a的第一個值 
a 3 a3:a的第三個值 
a 3 a3:a的第三個值 
b 1 b1--b的第一個值 
b 3 b3:b的第三個值 
b 2 b2b2b2b2 
b 4 b4b4 
b 5 b5b5b5b5b5 
*/ 


附:mysql “group by ”與"order by"的研究

 這兩天讓一個數據查詢難了。主要是對group by 理解的不夠深入。才出現這樣的情況

這種需求,我想很多人都遇到過。下面是我模擬我的內容表

我現在需要取出每個分類中最新的內容

 

select * from test group by category_id order by `date`


結果如下

明顯。這不是我想要的數據,原因是msyql已經的執行順序是

 

引用


寫的順序:select ... from... where.... group by... having... order by..
執行順序:from... where...group by... having.... select ... order by...


所以在order by拿到的結果里已經是分組的完的最后結果。
由from到where的結果如下的內容。

到group by時就得到了根據category_id分出來的多個小組

到了select的時候,只從上面的每個組里取第一條信息結果會如下

即使order by也只是從上面的結果里進行排序。並不是每個分類的最新信息。
回到我的目的上 --分類中最新的信息
根據上面的分析,group by到select時只取到分組里的第一條信息。有兩個解決方法
1,where+group by(對小組進行排序)
2,從form返回的數據下手腳(即用子查詢)
由where+group by的解決方法
對group by里的小組進行排序的函數我只查到group_concat()可以進行排序,但group_concat的作用是將小組里的字段里的值進行串聯起來。

select group_concat(id order by `date` desc) from `test` group by category_id

再改進一下

select * from `test` where id in(select SUBSTRING_INDEX(group_concat(id order by `date` desc),',',1) from `test` group by category_id ) order by `date` desc

子查詢解決方案

select * from (select * from `test` order by `date` desc) `temp`  group by category_id order by `date` desc

 

 

 

posted @ 2017-08-24 23:06  星朝  閱讀( 2774)  評論( 0編輯  收藏


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM