[SQL] SQL 基礎知識梳理(三) - 聚合和排序


SQL 基礎知識梳理(三) - 聚合和排序

【博主】反骨仔    【原文】http://www.cnblogs.com/liqingwen/p/5926689.html

 

 

  這是《SQL 基礎知識梳理(二) - 查詢基礎》的下篇。

 

目錄

 

一、對表進行聚合查詢 

  1.聚合函數

    (1)5 個常用函數

      ①COUNT:計算表中的記錄(行)數。

      ②SUM:計算表中數值列的數據合計值。

      ③AVG:計算表中數值列的數據平均值。

      ④MAX:求出表中任意列中數據的最大值。

      ⑤MIN:求出表中任意列中數據的最小值。

 

    (2)聚合:將多行匯總成一行。

圖1-1 Shohin 表

 

  2.計算表中數據的行數 

--示例
SELECT COUNT(*)  -- *:參數,這里代表全部列
FROM dbo.Shohin;

 

  3.計算 NULL 以外數據的行數

  將 COUNT(*) 的參數改成指定對象的列,就可以得到該列的非 NULL 行數

SELECT COUNT(shiire_tanka)
FROM dbo.Shohin;

只計算非 NULL 的行

  【備注】除了 COUNT 函數,其它函數不能將星號作為參數

  【備注】COUNT 函數的結果根據參數的不同而不同。COUNT(*) 會得到包含 NULL 的數據行數,而 COUNT(<列名>) 會得到 NULL 之外的數據行數。

 

  4.計算合計值

SELECT SUM(hanbai_tanka) AS sum_hanbai_tanka,    --總和
    AVG(hanbai_tanka) AS avg_hanbai_tanka,        --平均
    MAX(hanbai_tanka) AS max_hanbai_tanka,        --最大
    MIN(hanbai_tanka) AS min_hanbai_tanka        --最小
FROM dbo.Shohin;

  【備注】所有的聚合函數,如果以列名為參數,會無視 NULL 值所在的行。

 

SELECT MAX(torokubi),  --torokubi 為日期
    MIN(torokubi)
FROM dbo.Shohin

  【備注】MAX/MIN 函數幾乎適用於所有數據類型的列。SUM/AVG 函數只適用於數值類型的列。

 

  5.使用聚合函數刪除重復值(關鍵字 DISTINCT)

--示例1:計算去除重復數據后的數據行數
SELECT COUNT(DISTINCT shohin_bunrui)
FROM dbo.Shohin;

--示例2:先計算數據行數再刪除重復數據的結果
SELECT DISTINCT COUNT(shohin_bunrui)
FROM dbo.Shohin;

  【備注】在聚合函數的參數中使用 DISTINCT(示例1),可以刪除重復數據。DISTINCT 不僅限於 COUNT 函數,所有的聚合函數都可以使用。

 

二、對表進行分組

  1.GROUP BY 子句

--語法:
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--GROUP BY <列名1>, <列名2>, ...;
--示例
SELECT shohin_bunrui AS '商品種類',
    COUNT(*) AS '數量'
FROM dbo.Shohin
GROUP BY shohin_bunrui;

  【備注】GROUP BY 子句中指定的列稱為“聚合鍵”或“分組列”。

  【子句的書寫順序(暫定)】SELECT --> FROM --> WHERE --> GROUP BY

 

  2.聚合鍵中包含 NULL 的情況

SELECT shiire_tanka, COUNT(*)
FROM dbo.Shohin
GROUP BY shiire_tanka;

  【備注】聚合鍵中包含 NULL 時,在結果中也會以 NULL 行的形式表現出來。

 

  3.WHERE 對 GROUP BY 執行結果的影響

--語法
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--WHERE <表達式>
--GROUP BY <列名1>, <列名2>, ...
SELECT shiire_tanka, COUNT(*)
FROM dbo.Shohin
WHERE shohin_bunrui = '衣服'
GROUP BY shiire_tanka

  這里是先根據 WHERE 子句指定的條件進行過濾,然后再進行聚合處理。

  【執行順序】FROM --> WHERE --> GROUP BY --> SELECT。這里是執行順序,跟之前的書寫順序是不一樣的。

 

  4.與聚合函數和 GROUP BY 子句有關的常見錯誤

  (1)易錯:在 SELECT 子句中書寫了多余的列

    SELECT 子句只能存在以下三種元素:

      ①常數

      ②聚合函數

      ③GROUP BY 子句中指定的列名(即聚合鍵)

易錯點1

  【總結】使用 GROUP BY 子句時,SELECT 子句不能出現聚合鍵之外的列名。

  (2)易錯:在 GROUP BY 子句中寫了列的別名   

 

易錯點2

  回顧之前說的執行順序,SELECT 子句是在 GROUP BY 子句之后執行。所以執行到 GROUP BY 子句時無法識別別名。

  【總結】GROUP BY 子句不能使用 SELECT 子句中定義的別名。

 

  (3)易錯:GROUP BY 子句的結果能排序嗎?

  【解答】它是隨機的。如果想排序,請使用 ORDER BY 子句。

  【總結】GROUP BY 子句結果的顯示是無序的。

 

  (4)易錯:在 WHERE 子句中使用聚合函數

易錯點3

  【總結】只有 SELECT 子句和 HAVING 子句(以及 ORDER BY 子句)中能夠使用聚合函數。

  

三、為聚合結果指定條件

  1.HAVING 子句

  WHERE 子句智能指定記錄(行)的條件,而不能用來指定組的條件。

  【備注】HAVING 是 HAVE(擁有)的現在分詞。

--語法:
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--GROUP BY <列名1>, <列名2>, ...
--HAVING <分組結果對應的條件>

  【書寫順序】SELECT --> FROM --> WHERE --> GROUP BY --> HAVING

SELECT shohin_bunrui, COUNT(*)
FROM dbo.Shohin
GROUP BY shohin_bunrui
HAVING COUNT(*) = 2

從通過商品種類進行聚合分組后的結果中,取出“包含數據的行數為 2 行”的數據

  2.HAVING 子句的構成要素

    (1)3 要素:

      ①常數

      ②聚合函數

      ③GROUP BY 子句中指定的列名(即聚合鍵)

易錯用法

  3.HAVING 與 WHERE

  有些條件可以寫在 HAVING 子句中,又可以寫在 WHERE 子句中。這些條件就是聚合鍵所對應的條件

  

結果一樣

  【建議】雖然結果一樣,聚合鍵對應的條件應該寫在 WHERE 子句中,不是 HAVING 子句中。

  【理由】①WHERE 子句的執行速度比 HAVING 快。

      ②意義:WHERE 子句 = 指定行所對應的條件,HAVING 子句 = 指定組所對應的條件。

 

四、對查詢結果進行排序

  1.ORDER BY 子句

--語法:
--SELECT <列名1>, <列名2>, ...
--FROM <表名>
--ORDER BY <排序基准列1>, <排序基准列2>, ...
SELECT shohin_id, hanbai_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka;    --升序排列

銷售單價由低到高(升序)

  排序鍵:ORDER BY 子句中書寫的列名。

  【書寫順序】SELECT --> FROM --> WHERE --> GROUP BY --> HAVING --> ORDER BY

 

   2.升序(ASC)和降序(DESC):

SELECT shohin_id, hanbai_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka DESC;    --降序排列

  【備注】ORDER BY 子句中排列順序時會默認使用升序(ASC)進行排列。

 

  3.指定多個排序鍵

SELECT shohin_id, shohin_mei, hanbai_tanka, shiire_tanka
FROM dbo.Shohin
ORDER BY hanbai_tanka, shohin_id;

  4.NULL 值的順序:排序鍵中包含 NULL 時,會在開頭或末尾進行匯總。

 

  5.在排序鍵中使用 SELECT 子句中的別名

SELECT shohin_id AS id, shohin_mei, hanbai_tanka AS ht
FROM dbo.Shohin
ORDER BY ht, id;

 

  【執行順序】FROM --> WHERE --> GROUP BY --> HAVING --> SELECT --> ORDER BY

  【備注】ORDER BY 子句可以使用 SELECT 子句中定義的別名,GROUP BY 子句不能使用別名。

 

  6.ORDER BY 子句中使用聚合函數

SELECT shohin_bunrui, COUNT(*)
FROM dbo.Shohin
GROUP BY shohin_bunrui
ORDER BY COUNT(*);

  7.不建議使用列的編號進行排序,雖然可以

SELECT shohin_id ,
       shohin_mei ,
       shohin_bunrui ,
       hanbai_tanka ,
       shiire_tanka ,
       torokubi
FROM dbo.Shohin
ORDER BY hanbai_tanka DESC, shohin_id;

SELECT shohin_id ,
       shohin_mei ,
       shohin_bunrui ,
       hanbai_tanka ,
       shiire_tanka ,
       torokubi
FROM dbo.Shohin
ORDER BY 4 DESC, 1;  --這里使用列的編號,由於閱讀不便,不推薦使用

結果是一樣的

  【備注】在 ORDER BY 子句中不要使用列的編號。

 

傳送門

  《SQL 基礎知識梳理(一) - 數據庫與 SQL

  《SQL 基礎知識梳理(二) - 查詢基礎

 

備注

  這里采用 MS SQL Server 進行驗證,不保證所有的 DBMS 執行結果正確。

 



【參考】《SQL ゼロからはじめるデータベース操作》

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM