Mysql sql书写之——实现先排序后分组


 

最近在工作中遇到一个先排序后分组的需求,发现MySql不同的版本有不同的结果,特此记录。

举例:要求在shop表中查询出各类型商店中价格最高的商品。

--表结构--
create table `shop` (
  `id` int (10) PRIMARY KEY,
  `shop_name` varchar (100),
  `item_name` varchar (100),
  `price` int (10)
);

insert into `shop` (`id`, `shop_name`, `item_name`,`price`) values('1','小卖部','酱油','12');
insert into `shop` (`id`, `shop_name`, `item_name`,`price`) values('2','小卖部','','15');
insert into `shop` (`id`, `shop_name`, `item_name`,`price`) values('3','小卖部','脉动','20');
insert into `shop` (`id`, `shop_name`, `item_name`,`price`) values('4','小卖部','沙姜','2');
insert into `shop` (`id`, `shop_name`, `item_name`,`price`) values('5','超市','猪肉','24');
insert into `shop` (`id`, `shop_name`, `item_name`,`price`) values('6','超市','生菜','6');
insert into `shop` (`id`, `shop_name`, `item_name`,`price`) values('7','超市','菜心','5');
insert into `shop` (`id`, `shop_name`, `item_name`,`price`) values('8','连锁店','生姜','3');
insert into `shop` (`id`, `shop_name`, `item_name`,`price`) values('9','超市','牛肉','30');
insert into `shop` (`id`, `shop_name`, `item_name`,`price`) values('10','连锁店','蒜头','2');
insert into `shop` (`id`, `shop_name`, `item_name`,`price`) values('11','连锁店','黄瓜','20');

 

那么很自然地就想到了对价格price进行排序然后再根据商店类型shop_name进行分组查询

select * from (select * from shop order by price desc) a GROUP BY a.shop_name 


这条sql很简单易懂,接下来我们验证一下是否正确:

期望结果:

   


MySql 5.7.20下的实际结果:

  


可以看出来实际上得出的结果只是按照表数据的顺序,简单地进行了分组查询操作,但是这时候我们还不能下结论说这条sql就是错误的,我们用另一个数据库版本(MySql 5.5.57)测试一下。

MySql 5.5.57下的结果:

  

 

为什么会有不同的结果?

我们分别查看一下这条sql在两个不同版本数据库的执行计划:
MySql 5.7.20:

  

MySql 5.5.57:

  

对比可以发现5.7版本的MySql在执行这条sql时缺少了一个derived操作,通过查阅相关资料了解到MySql 5.7对子查询进行了优化,认为子查询中的order by可以进行忽略,只要Derived table里不包含如下条件就可以进行优化:

1.UNION clause
2.GROUP BY
3.DISTINCT
4.Aggregation
5.LIMIT or OFFSET
这里把链接放上:5.7中Derived table变形记

最后放上相应的解决办法:

--方法一,仅适用于低于5.7版本的MySql--
select * from (select * from shop order by price desc) a GROUP BY a.shop_name;

--方法二--
select * from (select * from shop order by price desc limit 999999) a GROUP BY a.shop_name;

--方法三--
select * from shop a where N > (select count(*) from shop b where b.shop_name = a.shop_name and a.price < b.price) order by a.shop_name,a.price desc;

方法二中使用limit,需要limit的范围足够大能包括所有数据,并且每种分类只会显示一条数据,但是数据较多时运行效率要比方法三快上很多,方法三能够控制每种分类显示多少条数据,把N换成需要显示对应的数字即可。

 

转载自:https://blog.csdn.net/lglaljj123/article/details/79864188

 


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM