Mysql order by與limit混用陷阱

本文轉載自查看原文 2017-07-04 20:15 24192

在Mysql中我們常常用order by來進行排序，使用limit來進行分頁，當需要先排序后分頁時我們往往使用類似的寫法select * from 表名 order by 排序字段 limt M,N。但是這種寫法卻隱藏着較深的使用陷阱。在排序字段有數據重復的情況下，會很容易出現排序結果與預期不一致的問題。

比如現在有一張user表，表結構及數據如下：

表結構

表數據

現在想根據創建時間升序查詢user表，並且分頁查詢，每頁2條，那很容易寫出sql為：select * from user order by create_time limit pageNo,2;

在執行查詢過程中會發現：
1、查詢第一頁數據時：

第一頁查詢結果

2、查詢第四頁數據時：

第四頁查詢結果

user表共有8條數據，有4頁數據，但是實際查詢過程中第一頁與第四頁竟然出現了相同的數據。

這是什么情況？難道上面的分頁SQL不是先將兩個表關聯查詢出來，然后再排好序，再取對應分頁的數據嗎？？？

上面的實際執行結果已經證明現實與想像往往是有差距的，實際SQL執行時並不是按照上述方式執行的。這里其實是Mysql會對Limit做優化，具體優化方式見官方文檔：https://dev.mysql.com/doc/refman/5.7/en/limit-optimization.html
這個是5.7版本的說明，提取幾個問題直接相關的點做下說明。

Paste_Image.png

上面官方文檔里面有提到如果你將Limit row_count與order by混用，mysql會找到排序的row_count行后立馬返回，而不是排序整個查詢結果再返回。如果是通過索引排序，會非常快；如果是文件排序，所有匹配查詢的行（不帶Limit的）都會被選中，被選中的大多數或者全部會被排序，直到limit要求的row_count被找到了。如果limit要求的row_count行一旦被找到，Mysql就不會排序結果集中剩余的行了。

這里我們查看下對應SQL的執行計划：