開發過程中經常遇到分頁的需求,今天在此總結一下吧。
簡單說來方法有兩種,一種在源上控制,一種在端上控制。源上控制把分頁邏輯放在SQL層;端上控制一次性獲取所有數據,把分頁邏輯放在UI上(如GridView)。顯然,端上控制開發難度低,適於小規模數據,但數據量增大時性能和IO消耗無法接受;源上控制在性能和開發難度上較為平衡,適應大多數業務場景;除此之外,還可以根據客觀情況(性能要求,源與端的資源占用等)在源和端之間加一層,應用特殊算法和技術進行處理。以下主要討論源上,即SQL上的分頁。
分頁的問題其實就是在滿足條件的一堆有序數據中截取當前所需要展示的那部分。實際上各種數據庫都考慮到分頁問題而內置了一些策略,比如MySql的LIMIT,Oracle的ROWNUM和ROW_NUMBER(),SqlServer的TOP和ROW_NUMBER(),基於此我們可以得到一系列分頁的方法。
1、 基於MySql的LIMIT和Oracle的ROWNUM,可以直接限制返回區間(以MySql為例,注意使用Oracle的ROWNUM時要應用子查詢):
方法一、直接限制返回區間
SELECT * FROM table WHERE 查詢條件 ORDER BY 排序條件 LIMIT ((頁碼-1)*頁大小),頁大小;
優點:寫法簡單。
缺點:當頁碼和頁大小過大時,性能明顯下降。
適用:數據量不大。
2、基於LIMIT(MySql)、ROWNUM(Oracle)和TOP(SqlServer),他們可以限制返回的行數,因此可以得到以下兩套通用的方法(以SqlServer為例):
方法二、NOT IN
SELECT TOP 頁大小 * FROM table WHERE 主鍵 NOT IN ( SELECT TOP (頁碼-1)*頁大小 主鍵 FROM table WHERE 查詢條件 ORDER BY 排序條件 ) ORDER BY 排序條件
優點:通用性強。
缺點:當數據量較大時向后翻頁,NOT IN中的數據過大會影響性能。
適用:數據量不大。
方法三、MAX
SELECT TOP 頁大小 * FROM table WHERE 查詢條件 AND id > ( SELECT ISNULL(MAX(id),0) FROM ( SELECT TOP ((頁碼-1)*頁大小) id FROM table WHERE 查詢條件 ORDER BY id ) AS tempTable ) ORDER BY id
優點:速度快,特別是當id為主鍵時。
缺點:適用面窄,要求排序條件單一且可比較。
適用:簡單排序(特殊情況也可嘗試轉換成類似可比較值處理)。
3、基於SqlServer和Oracle的ROW_NUMBER(),可以得到返回數據的行號,基於此在限制返回區間得到如下方法(以SqlServer為例):
方法四、ROW_NUMBER()
SELECT TOP 頁大小 * FROM ( SELECT TOP (頁碼*頁大小) ROW_NUMBER() OVER (ORDER BY 排序條件) AS RowNum, * FROM table WHERE 查詢條件 ) AS tempTable WHERE RowNum BETWEEN (頁碼-1)*頁大小+1 AND 頁碼*頁大小 ORDER BY RowNum
優點:在數據量較大時相比NOT IN有優勢。
缺點:小數據量時不如NOT IN。
適用:大部分分頁查詢需求。
以上是自己總結的拙見,性能比較來自網上資料及個人判斷,並沒有深入實驗,不當之處請大家指正。