SQL 子查詢簡介


學習重點

  • 一言以蔽之,子查詢就是一次性視圖(SELECT 語句)。與視圖不同,子查詢在 SELECT 語句執行完畢之后就會消失。

  • 由於子查詢需要命名,因此需要根據處理內容來指定恰當的名稱。

  • 標量子查詢就是只能返回一行一列的子查詢。

一、子查詢和視圖

前一節我們學習了視圖這個非常方便的工具,本節將學習以視圖為基礎的子查詢。子查詢的特點概括起來就是一張一次性視圖。

KEYWORD

  • 子查詢

我們先來復習一下視圖的概念,視圖並不是用來保存數據的,而是通過保存讀取數據的 SELECT 語句的方法來為用戶提供便利。反之,子查詢就是將用來定義視圖的 SELECT 語句直接用於 FROM 子句當中。接下來,就讓我們拿前一節使用的視圖 ProductSum(商品合計)來與子查詢進行一番比較吧。

首先,我們再來看一下視圖 ProductSum 的定義和視圖所對應的 SELECT 語句(代碼清單 8)。

代碼清單 8 視圖 ProductSum 和確認用的 SELECT 語句

-- 根據商品種類統計商品數量的視圖
CREATE VIEW ProductSum (product_type, cnt_product)
AS
SELECT product_type, COUNT(*)
  FROM Product
 GROUP BY product_type;

-- 確認創建好的視圖
SELECT product_type, cnt_product
  FROM ProductSum;

能夠實現同樣功能的子查詢如代碼清單 9 所示。

代碼清單 9 子查詢

子查詢

特定的 SQL

在 Oracle 的 FROM 子句中,不能使用 AS(會發生錯誤),因此,在 Oracle 中執行代碼清單 9 時,需要將 ① 中的“) AS ProductSum;”變為“) ProductSum;

兩種方法得到的結果完全相同。

執行結果

 product_type | cnt_product
--------------+------------
 衣服         |           2
 辦公用品     |           2
 廚房用具     |           4

如上所示,子查詢就是將用來定義視圖的 SELECT 語句直接用於 FROM 子句當中。雖然“AS ProductSum”就是子查詢的名稱,但由於該名稱是一次性的,因此不會像視圖那樣保存在存儲介質(硬盤)之中,而是在 SELECT 語句執行之后就消失了。

實際上,該 SELECT 語句包含嵌套的結構,首先會執行 FROM 子句中的 SELECT 語句,然后才會執行外層的 SELECT 語句(圖 4)。

SELECT 語句的執行順序

圖 4 SELECT 語句的執行順序

① 首先執行 FROM 子句中的 SELECT 語句(子查詢)

SELECT product_type, COUNT(*) AS cnt_product
  FROM Product
 GROUP BY product_type;

② 根據 ① 的結果執行外層的 SELECT 語句

SELECT product_type, cnt_product
  FROM ProductSum;

法則 6

子查詢作為內層查詢會首先執行。

  • 增加子查詢的層數

    由於子查詢的層數原則上沒有限制,因此可以像“子查詢的 FROM 子句中還可以繼續使用子查詢,該子查詢的 FROM 子句中還可以再使用子查詢……”這樣無限嵌套下去(代碼清單 10)。

    代碼清單 10 嘗試增加子查詢的嵌套層數

    SQL Server DB2 PostgreSQL MySQL

    SELECT product_type, cnt_product
    FROM (SELECT *
            FROM (SELECT product_type, COUNT(*) AS cnt_product
                    FROM Product
                    GROUP BY product_type) AS ProductSum -----①
            WHERE cnt_product = 4) AS ProductSum2; -----------②
    

    特定的 SQL

    在 Oracle 的 FROM 子句中不能使用 AS(會發生錯誤),因此,在 Oracle 中執行代碼清單 10 時,需要將 ① 中的“) AS ProductSum”變為“) ProductSum”,將 ② 中的“) AS ProductSum2;”變為“) ProductSum2;”。

    執行結果

    product_type | cnt_product
    --------------+------------
    廚房用具     |           4
    

    最內層的子查詢(ProductSum)與之前一樣,根據商品種類(product_type)對數據進行匯總,其外層的子查詢將商品數量(cnt_product)限定為 4,結果就得到了 1 行廚房用具的數據。

    但是,隨着子查詢嵌套層數的增加,SQL 語句會變得越來越難讀懂,性能也會越來越差。因此,請大家盡量避免使用多層嵌套的子查詢。

二、子查詢的名稱

之前的例子中我們給子查詢設定了 ProductSum 等名稱。原則上子查詢必須設定名稱,因此請大家盡量從處理內容的角度出發為子查詢設定恰當的名稱。在上述例子中,子查詢用來對 Product 表的數據進行匯總,因此我們使用了后綴 Sum 作為其名稱。

為子查詢設定名稱時需要使用 AS 關鍵字,該關鍵字有時也可以省略 [1]

三、標量子查詢

接下來我們學習子查詢中的標量子查詢(scalar subquery)。

KEYWORD

  • 標量子查詢
  • 什么是標量

    標量就是單一的意思,在數據庫之外的領域也經常使用。

    KEYWORD

    • 標量

    上一節我們學習的子查詢基本上都會返回多行結果(雖然偶爾也會只返回 1 行數據)。由於結構和表相同,因此也會有查詢不到結果的情況。

    而標量子查詢則有一個特殊的限制,那就是必須而且只能返回 1 行 1 列的結果,也就是返回表中某一行的某一列的值,例如“10”或者“東京都”這樣的值。

    KEYWORD

    • 返回值

      返回值就是函數或者 SQL 語句等處理執行之后作為結果返回的值。

    法則 7

    標量子查詢就是返回單一值的子查詢。

    細心的讀者可能會發現,由於返回的是單一的值,因此標量子查詢的返回值可以用在 = 或者 <> 這樣需要單一值的比較運算符之中。這也正是標量子查詢的優勢所在。下面就讓我們趕快來試試看吧。

  • WHERE 子句中使用標量子查詢

    數據的刪除 中,我們練習了通過各種各樣的條件從 Product(商品)表中讀取數據。大家有沒有想過通過下面這樣的條件查詢數據呢?

    “查詢出銷售單價高於平均銷售單價的商品。”

    或者說想知道價格處於上游的商品時,也可以通過上述條件進行查詢。

    然而這並不是用普通方法就能解決的。如果我們像下面這樣使用 AVG 函數的話,就會發生錯誤。

    在 WHERE 子句中不能使用聚合函數

    雖然這樣的 SELECT 語句看上去能夠滿足我們的要求,但是由於在 WHERE 子句中不能使用聚合函數,因此這樣的 SELECT 語句是錯誤的。

    那么究竟什么樣的 SELECT 語句才能滿足上述條件呢?

    這時標量子查詢就可以發揮它的功效了。首先,如果想要求出 Product 表中商品的平均銷售單價(sale_price),可以使用代碼清單 11 中的 SELECT 語句。

    代碼清單 11 計算平均銷售單價的標量子查詢

    SELECT AVG(sale_price)
    FROM Product;
    

    執行結果

            avg
    ----------------------
    2097.5000000000000000
    

    AVG 函數的使用方法和 COUNT 函數相同,其計算式如下所示。

    (1000+500+4000+3000+6800+500+880+100) / 8=2097.5

    這樣計算出的平均單價大約就是 2100 日元。不難發現,代碼清單 11 中的 SELECT 語句的查詢結果是單一的值(2097.5)。因此,我們可以直接將這個結果用到之前失敗的查詢之中。正確的 SQL 如代碼清單 12 所示。

    代碼清單 12 選取出銷售單價(sale_price)高於全部商品的平均單價的商品

    選取出銷售單價(sale_price)高於全部商品的平均單價的商品

    執行結果

    product_id | product_name | sale_price
    ------------+--------------+-----------
    0003       | 運動T恤      |       4000
    0004       | 菜刀         |       3000
    0005       | 高壓鍋       |       6800
    

    前一節我們已經介紹過,使用子查詢的 SQL 會從子查詢開始執行。因此,這種情況下也會先執行下述計算平均單價的子查詢(圖 5)。

    SELECT 語句的執行順序(標量子查詢)

    圖 5 SELECT 語句的執行順序(標量子查詢)

    -- ① 內層的子查詢
    SELECT AVG(sale_price)
    FROM Product;
    

    子查詢的結果是 2097.5,因此會用該值替換子查詢的部分,生成如下 SELECT 語句。

    -- ② 外層的查詢
    SELECT product_id, product_name, sale_price
    FROM Product
    WHERE sale_price > 2097.5
    

    大家都能看出該 SQL 沒有任何問題可以正常執行,結果如上所述。

四、標量子查詢的書寫位置

標量子查詢的書寫位置並不僅僅局限於 WHERE 子句中,通常任何可以使用單一值的位置都可以使用。也就是說,能夠使用常數或者列名的地 方,無論是 SELECT 子句、GROUP BY 子句、HAVING 子句,還是 ORDER BY 子句,幾乎所有的地方都可以使用

例如,在 SELECT 子句當中使用之前計算平均值的標量子查詢的 SQL 語句,如代碼清單 13 所示。

代碼清單 13 在 SELECT 子句中使用標量子查詢

在 SELECT 子句中使用標量子查詢

執行結果

 product_id | product_name  | sale_price |       avg_price
------------+---------------+------------+----------------------
 0001       | T恤衫         |       1000 | 2097.5000000000000000
 0002       | 打孔器        |        500 | 2097.5000000000000000
 0003       | 運動T恤       |       4000 | 2097.5000000000000000
 0004       | 菜刀          |       3000 | 2097.5000000000000000
 0005       | 高壓鍋        |       6800 | 2097.5000000000000000
 0006       | 叉子          |        500 | 2097.5000000000000000
 0007       | 擦菜板        |        880 | 2097.5000000000000000
 0008       | 圓珠筆        |        100 | 2097.5000000000000000

從上述結果可以看出,在商品一覽表中加入了全部商品的平均單價。有時我們會需要這樣的單據。

此外,我們還可以像代碼清單 14 中的 SELECT 語句那樣,在 HAVING 子句中使用標量子查詢。

代碼清單 14 在 HAVING 子句中使用標量子查詢

在 HAVING 子句中使用標量子查詢

執行結果

 product_type |         avg
--------------+----------------------
 衣服         | 2500.0000000000000000
 廚房用具     | 2795.0000000000000000

該查詢的含義是想要選取出按照商品種類計算出的銷售單價高於全部商品的平均銷售單價的商品種類。如果在 SELECT 語句中不使用 HAVING 子句的話,那么平均銷售單價為 300 日元的辦公用品也會被選取出來。但是,由於全部商品的平均銷售單價是 2097.5 日元,因此低於該平均值的辦公用品會被 HAVING 子句中的條件排除在外。

五、使用標量子查詢時的注意事項

最后我們來介紹一下使用標量子查詢時的注意事項,那就是該子查詢絕對不能返回多行結果。也就是說,如果子查詢返回了多行結果,那么它就不再是標量子查詢,而僅僅是一個普通的子查詢了,因此不能被用在 = 或者 <> 等需要單一輸入值的運算符當中,也不能用在 SELECT 等子句當中。

例如,如下的 SELECT 子查詢會發生錯誤。

如下的 SELECT 子查詢會發生錯誤

發生錯誤的原因很簡單,就是因為會返回如下多行結果。

         avg
----------------------
2500.0000000000000000
300.0000000000000000
2795.0000000000000000

在 1 行 SELECT 子句之中當然不可能使用 3 行數據。因此,上述 SELECT 語句會返回“因為子查詢返回了多行數據所以不能執行”這樣的錯誤信息 [2]

請參閱

(完)


  1. 其中也有像 Oracle 這樣,在名稱之前使用 AS 關鍵字就會發生錯誤的數據庫,大家可以將其視為例外的情況。 ↩︎

  2. 例如,使用 PostgreSQL 時會返回如下錯誤:“ERROR :副查詢中使用了返回多行結果的表達式” ↩︎


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM