[SQL] SQL 基礎知識梳理（三） - 聚合和排序

本文轉載自查看原文 2016-10-09 13:00 11114

SQL 基礎知識梳理（三） - 聚合和排序

【博主】反骨仔　　　　【原文】http://www.cnblogs.com/liqingwen/p/5926689.html

序

　　這是《SQL 基礎知識梳理（二） - 查詢基礎》的下篇。

一、對表進行聚合查詢

　　1.聚合函數

　　　　（1）5 個常用函數：

　　　　　　①COUNT：計算表中的記錄（行）數。

　　　　　　②SUM：計算表中數值列的數據合計值。

　　　　　　③AVG：計算表中數值列的數據平均值。

　　　　　　④MAX：求出表中任意列中數據的最大值。

　　　　　　⑤MIN：求出表中任意列中數據的最小值。

　　　　（2）聚合：將多行匯總成一行。

圖1-1 Shohin 表

　　2.計算表中數據的行數　

--示例
SELECT COUNT(*)　　-- *：參數，這里代表全部列
FROM dbo.Shohin;

　　3.計算 NULL 以外數據的行數

　　將 COUNT(*) 的參數改成指定對象的列，就可以得到該列的非 NULL 行數。

SELECT COUNT(shiire_tanka)
FROM dbo.Shohin;

只計算非 NULL 的行

　　【備注】除了 COUNT 函數，其它函數不能將星號作為參數。

　　【備注】COUNT 函數的結果根據參數的不同而不同。COUNT(*) 會得到包含 NULL 的數據行數，而 COUNT(<列名>) 會得到 NULL 之外的數據行數。

　　4.計算合計值

SELECT SUM(hanbai_tanka) AS sum_hanbai_tanka,    --總和
    AVG(hanbai_tanka) AS avg_hanbai_tanka,        --平均
    MAX(hanbai_tanka) AS max_hanbai_tanka,        --最大
    MIN(hanbai_tanka) AS min_hanbai_tanka        --最小
FROM dbo.Shohin;

　　【備注】所有的聚合函數，如果以列名為參數，會無視 NULL 值所在的行。

SELECT MAX(torokubi),　　--torokubi 為日期
    MIN(torokubi)
FROM dbo.Shohin

　　【備注】MAX/MIN 函數幾乎適用於所有數據類型的列。SUM/AVG 函數只適用於數值類型的列。

　　5.使用聚合函數刪除重復值（關鍵字 DISTINCT）

--示例1：計算去除重復數據后的數據行數
SELECT COUNT(DISTINCT shohin_bunrui)
FROM dbo.Shohin;

--示例2：先計算數據行數再刪除重復數據的結果
SELECT DISTINCT COUNT(shohin_bunrui)
FROM dbo.Shohin;

　　【備注】在聚合函數的參數中使用 DISTINCT（示例1），可以刪除重復數據。DISTINCT 不僅限於 COUNT 函數，所有的聚合函數都可以使用。

二、對表進行分組

　　1.GROUP BY 子句

--語法：
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--GROUP BY <列名1>, <列名2>, ...;

--示例
SELECT shohin_bunrui AS '商品種類',
    COUNT(*) AS '數量'
FROM dbo.Shohin
GROUP BY shohin_bunrui;

　　【備注】GROUP BY 子句中指定的列稱為“聚合鍵”或“分組列”。

　　【子句的書寫順序（暫定）】SELECT --> FROM --> WHERE --> GROUP BY

　　2.聚合鍵中包含 NULL 的情況

SELECT shiire_tanka, COUNT(*)
FROM dbo.Shohin
GROUP BY shiire_tanka;

　　【備注】聚合鍵中包含 NULL 時，在結果中也會以 NULL 行的形式表現出來。

　　3.WHERE 對 GROUP BY 執行結果的影響

--語法
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--WHERE <表達式>
--GROUP BY <列名1>, <列名2>, ...

SELECT shiire_tanka, COUNT(*)
FROM dbo.Shohin
WHERE shohin_bunrui = '衣服'
GROUP BY shiire_tanka

　　這里是先根據 WHERE 子句指定的條件進行過濾，然后再進行聚合處理。

　　【執行順序】FROM --> WHERE --> GROUP BY --> SELECT。這里是執行順序，跟之前的書寫順序是不一樣的。

　　4.與聚合函數和 GROUP BY 子句有關的常見錯誤

　　（1）易錯：在 SELECT 子句中書寫了多余的列

　　　　SELECT 子句只能存在以下三種元素：

　　　　　　①常數

　　　　　　②聚合函數

　　　　　　③GROUP BY 子句中指定的列名（即聚合鍵）

易錯點1

　　【總結】使用 GROUP BY 子句時，SELECT 子句不能出現聚合鍵之外的列名。

　　（2）易錯：在 GROUP BY 子句中寫了列的別名　　　

易錯點2

　　回顧之前說的執行順序，SELECT 子句是在 GROUP BY 子句之后執行。所以執行到 GROUP BY 子句時無法識別別名。

　　【總結】GROUP BY 子句不能使用 SELECT 子句中定義的別名。

　　（3）易錯：GROUP BY 子句的結果能排序嗎？

　　【解答】它是隨機的。如果想排序，請使用 ORDER BY 子句。

　　【總結】GROUP BY 子句結果的顯示是無序的。

　　（4）易錯：在 WHERE 子句中使用聚合函數

易錯點3

　　【總結】只有 SELECT 子句和 HAVING 子句（以及 ORDER BY 子句）中能夠使用聚合函數。

三、為聚合結果指定條件

　　1.HAVING 子句

　　WHERE 子句智能指定記錄（行）的條件，而不能用來指定組的條件。

　　【備注】HAVING 是 HAVE（擁有）的現在分詞。

--語法：
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--GROUP BY <列名1>, <列名2>, ...
--HAVING <分組結果對應的條件>

　　【書寫順序】SELECT --> FROM --> WHERE --> GROUP BY --> HAVING

SELECT shohin_bunrui, COUNT(*)
FROM dbo.Shohin
GROUP BY shohin_bunrui
HAVING COUNT(*) = 2

從通過商品種類進行聚合分組后的結果中，取出“包含數據的行數為 2 行”的數據

　　2.HAVING 子句的構成要素

　　　　（1）3 要素：

　　　　　　①常數

　　　　　　②聚合函數

　　　　　　③GROUP BY 子句中指定的列名（即聚合鍵）

易錯用法

　　3.HAVING 與 WHERE

　　有些條件可以寫在 HAVING 子句中，又可以寫在 WHERE 子句中。這些條件就是聚合鍵所對應的條件。

結果一樣

　　【建議】雖然結果一樣，聚合鍵對應的條件應該寫在 WHERE 子句中，不是 HAVING 子句中。

　　【理由】①WHERE 子句的執行速度比 HAVING 快。

　　　　　　②意義：WHERE 子句 = 指定行所對應的條件，HAVING 子句 = 指定組所對應的條件。

四、對查詢結果進行排序

　　1.ORDER BY 子句

--語法：
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--ORDER BY <排序基准列1>, <排序基准列2>, ...

SELECT shohin_id, hanbai_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka;    --升序排列

銷售單價由低到高（升序）

　　排序鍵：ORDER BY 子句中書寫的列名。

　　【書寫順序】SELECT --> FROM --> WHERE --> GROUP BY --> HAVING --> ORDER BY

　　2.升序（ASC）和降序（DESC）：

SELECT shohin_id, hanbai_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka DESC;    --降序排列

　　【備注】ORDER BY 子句中排列順序時會默認使用升序（ASC）進行排列。

　　3.指定多個排序鍵

SELECT shohin_id, shohin_mei, hanbai_tanka, shiire_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka, shohin_id;

　　4.NULL 值的順序：排序鍵中包含 NULL 時，會在開頭或末尾進行匯總。

　　5.在排序鍵中使用 SELECT 子句中的別名

SELECT shohin_id AS id, shohin_mei, hanbai_tanka AS ht
FROM dbo.Shohin
ORDER BY ht, id;

　　【執行順序】FROM --> WHERE --> GROUP BY --> HAVING --> SELECT --> ORDER BY

　　【備注】ORDER BY 子句可以使用 SELECT 子句中定義的別名，GROUP BY 子句不能使用別名。

　　6.ORDER BY 子句中使用聚合函數

SELECT shohin_bunrui, COUNT(*)
FROM dbo.Shohin
GROUP BY shohin_bunrui
ORDER BY COUNT(*);

　　7.不建議使用列的編號進行排序，雖然可以

SELECT shohin_id ,
       shohin_mei ,
       shohin_bunrui ,
       hanbai_tanka ,
       shiire_tanka ,
       torokubi
FROM dbo.Shohin
ORDER BY hanbai_tanka DESC, shohin_id;

SELECT shohin_id ,
       shohin_mei ,
       shohin_bunrui ,
       hanbai_tanka ,
       shiire_tanka ,
       torokubi
FROM dbo.Shohin
ORDER BY 4 DESC, 1;　　--這里使用列的編號，由於閱讀不便，不推薦使用