一、基礎
1.1 SQL查詢的基本原理
第一、單表查詢:根據WHERE條件過濾表中的記錄,形成中間表(這個中間表對用戶是不可見的);然后根據SELECT的選擇列選擇相應的列進行返回最終結果。
第二、兩表連接查詢:對兩表求積(笛卡爾積)並用ON條件和連接連接類型進行過濾形成中間表;然后根據WHERE條件過濾中間表的記錄,並根據SELECT指定的列返回查詢結果。
第三、多表連接查詢:先對第一個和第二個表按照兩表連接做查詢,然后用查詢結果和第三個表做連接查詢,以此類推,直到所有的表都連接上為止,最終形成一個中間的結果表,然后根據WHERE條件過濾中間表的記錄,並根據SELECT指定的列返回查詢結果。
理解SQL查詢的過程是進行SQL優化的理論依據。
1.2 ON后面的條件(ON條件)和WHERE條件的區別
ON條件:
是過濾兩個鏈接表笛卡爾積形成中間表的約束條件。
WHERE條件:
在有ON條件的SELECT語句中是過濾中間表的約束條件。
在沒有ON的單表查詢中,是限制物理表或者中間查詢結果返回記錄的約束。
在兩表或多表連接中是限制連接形成最終中間表的返回結果的約束。
從這里可以看出,將WHERE條件移入ON后面是不恰當的。推薦的做法是:ON只進行連接操作,WHERE只過濾中間表的記錄。
二、連接查詢
連接運算符是用來實現多表聯合查詢的一種重要方式,主要分為三種:內連接、外連接、交叉連接。
2.1 內連接 INNER JOIN
內連接(INNER JOIN)有兩種,顯式的和隱式的,返回連接表中符合連接條件和查詢條件的數據行。(所謂的鏈接表就是數據庫在做查詢形成的中間表)。
內連接使用比較運算符(包括=、>、<、<>、>=、<=、!> 和!<)進行表間的比較操作,查詢與連接條件相匹配的數據。根據所使用的比較方式不同,內連接分為等值連接、自然連接和自連接三種。
語句1:隱式的內連接,沒有INNER JOIN,形成的中間表為兩個表的笛卡爾積。
SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME
FROM CUSTOMERS C,ORDERS O
WHERE C.ID=O.CUSTOMER_ID;
語句2:顯示的內連接,一般稱為內連接,有INNER JOIN,形成的中間表為兩個表經過ON條件過濾后的笛卡爾積。
SELECT O.ID,O.ORDER_NUMBER,C.ID,C.NAME
FROM CUSTOMERS C INNER JOIN ORDERS O ON C.ID=O.CUSTOMER_ID;
等值連接
使用”=”關系將表連接起來的查詢,其查詢結果中列出被連接表中的所有列,包括其中的重復列。
1 SELECT 2 PM_ACT_JOB_RLS.*, PM_ACT_RLS.* 3 FROM 4 PM_ACT_JOB_RLS 5 INNER JOIN PM_ACT_RLS ON PM_ACT_JOB_RLS.RlsPK = PM_ACT_RLS.RlsPK
自然連接
等值連接中去掉重復的列,形成的連接。
說真的,這種連接查詢沒有存在的價值,既然是SQL2標准中定義的,就給出個例子看看吧。自然連接無需指定連接列,SQL會檢查兩個表中是否相同名稱的列,且假設他們在連接條件中使用,並且在連接條件中僅包含一個連接列。不允許使用ON語句,不允許指定顯示列,顯示列只能用*表示(ORACLE環境下測試的)。對於每種連接類型(除了交叉連接外),均可指定NATURAL。
1 SELECT 2 PM_ACT_JOB_RLS.JobPK, PM_ACT_RLS.RlsPK, RlsName 3 FROM 4 PM_ACT_JOB_RLS 5 Natural INNER JOIN PM_ACT_RLS ON PM_ACT_JOB_RLS.RlsPK = PM_ACT_RLS.RlsPK
語句1:
SELECT *
FROM ORDERS O NATURAL INNER JOIN CUSTOMERS C;
語句2:
SELECT *
FROM ORDERS O NATURAL LEFT OUTER JOIN CUSTOMERS C;
語句3:
SELECT *
FROM ORDERS O NATURAL RIGHT OUTER JOIN CUSTOMERS C;
語句4:
SELECT *
FROM ORDERS O NATURAL FULL OUTER JOIN CUSTOMERS C;
自連接
如果在一個連接查詢中,設計到的兩個表都是同一個表,這種查詢稱為自連接查詢。
1 --c1、c2邏輯上是兩張表,物理上是一張表 SELECT 2 c1.CategoryID, 3 c1.CategoryName 4 FROM 5 [dbo].[Category] c1 6 INNER JOIN [dbo].[Category] c2 ON c1.[CategoryID] = c2.[ParentID]
聯合連接(UNION JOIN)
這是一種很少見的連接方式。Oracle、MySQL均不支持,其作用是:找出全外連接和內連接之間差異的所有行。這在數據分析中排錯中比較常用。也可以利用數據庫的集合操作來實現此功能。
語句1:聯合查詢(UNION JOIN)例句,還沒有找到能執行的SQL環境。
SELECT1 O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O UNION JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
語句2:語句11在DB2下的等價實現。還不知道DB2是否支持語句11呢!
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
EXCEPT
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O INNER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
語句3:語句1在Oracle下的等價實現。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
MINUS
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O INNER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
2.2 外連接
內連接只返回滿足連接條件的數據行,外連接不只列出與連接條件相匹配的行,而是列出左表(左外連接時)、右表(右外連接時)或兩個表(全外連接時)中所有符合搜索條件的數據行。
外連接分為左外連接、右外鏈接、全外連接三種。
1)LEFT JOIN或LEFT OUTER JOIN
左向外聯接的結果集包括 LEFT OUTER子句中指定的左表的所有行,而不僅僅是聯接列所匹配的行。如果左表的某行在右表中沒有匹配行,則在相關聯的結果集行中右表的所有選擇列表列均為空值。
2)RIGHT JOIN 或 RIGHT OUTER JOIN
右向外聯接是左向外聯接的反向聯接。將返回右表的所有行。如果右表的某行在左表中沒有匹配行,則將為左表返回空值。
3)FULL JOIN 或 FULL OUTER JOIN
完整外部聯接返回左表和右表中的所有行。當某行在另一個表中沒有匹配行時,則另一個表的選擇列表列包含空值。如果表之間有匹配行,則整個結果集行包含基表的數據值。
語句1:左外連接(LEFT OUTER JOIN)
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
語句2:右外連接(RIGHT OUTER JOIN)
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O RIGHT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
注意:WHERE條件放在ON后面查詢的結果是不一樣的。例如:
語句3:WHERE條件獨立。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
WHERE O.ORDER_NUMBER<>'MIKE_ORDER001';
語句4:將語句7中的WHERE條件放到ON后面。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID AND O.ORDER_NUMBER<>'MIKE_ORDER001';
從語句3和語句4查詢的結果來看,顯然是不相同的,語句8顯示的結果是難以理解的。因此,推薦在寫連接查詢的時候,ON后面只跟連接條件,而對中間表限制的條件都寫到WHERE子句中。
全外連接(FULL OUTER JOIN)
注意:MySQL是不支持全外的連接的,這里給出的寫法適合Oracle和DB2。但是可以通過左外和右外求合集來獲取全外連接的查詢結果。
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O FULL OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
左外和右外的合集
實際上查詢結果和上面的全外連接語句是相同的
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O LEFT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID
UNION
SELECT O.ID,O.ORDER_NUMBER,O.CUSTOMER_ID,C.ID,C.NAME
FROM ORDERS O RIGHT OUTER JOIN CUSTOMERS C ON C.ID=O.CUSTOMER_ID;
2.3 交叉連接
交叉連接(CROSS JOIN):有兩種,顯式的和隱式的。不帶ON子句,返回的是兩表的乘積,也叫笛卡爾積。
語句1:隱式的交叉連接,沒有CROSS JOIN。
SELECT O.ID, O.ORDER_NUMBER, C.ID, C.NAME
FROM ORDERS O , CUSTOMERS C
WHERE O.ID=1;
語句2:顯式的交叉連接,使用CROSS JOIN。
SELECT O.ID,O.ORDER_NUMBER,C.ID,
C.NAME
FROM ORDERS O CROSS JOIN CUSTOMERS C
WHERE O.ID=1;
語句1和語句2的結果是相同的
3 例子
(一) 示例1
a表 | b表 | |||
id | name | id | job | parent_id |
1 | 張3 | 1 | 23 | 1 |
2 | 李四 | 2 | 34 | 2 |
3 | 王武 | 3 | 34 | 4 |
1) 內連接
select a.*,b.* from a inner join b on a.id=b.parent_id
結果是
1 張3 1 23 1
2 李四 2 34 2
2)左連接
select a.*,b.* from a left join b on a.id=b.parent_id
結果是
1 張3 1 23 1
2 李四 2 34 2
3 王武 null
3) 右連接
select a.*,b.* from a right join b on a.id=b.parent_id
結果是
1 張3 1 23 1
2 李四 2 34 2
null 3 34 4
4) 完全連接
select a.*,b.* from a full join b on a.id=b.parent_id
結果是
1 張3 1 23 1
2 李四 2 34 2
null 3 34 4
3 王武 null
(二) 示例2
數據庫版本:Oracle
表TESTA,TESTB,TESTC,各有A, B兩列
A.內連接
內連接,即最常見的等值連接,例:
SELECT
*
FROM
TESTA,TESTB
WHERE
TESTA.A=TESTB.A
結果:
B.外連接
外連接分為左外連接,右外連接和全外連接。
1. 左外連接 left outer join 或者 left join
左外連接就是在等值連接的基礎上加上主表中的未匹配數據,例:
SELECT
*
FROM
TESTA
LEFT
OUTER
JOIN
TESTB
ON
TESTA.A=TESTB.A
結果:
三個表做左外鏈接:
SELECT
*
FROM
TESTA
LEFT
OUTER
JOIN
TESTB
ON
TESTA.A=TESTB.A
LEFT
OUTER
JOIN
TESTC
ON
TESTA.A=TESTC.A

2. 右外連接 right outer join 或者 right join
右外連接是在等值連接的基礎上加上被連接表的不匹配數據
SELECT
*
FROM
TESTA
RIGHT
OUTER
JOIN
TESTB
ON
TESTA.A=TESTB.A

3.全外連接 full outer join 或者 full join
全外連接是在等值連接的基礎上將左表和右表的未匹配數據都加上。
SELECT
*
FROM
TESTA
FULL
OUTER
JOIN
TESTB
ON
TESTA.A=TESTB.A

二、總結
(1)內、外連接的區別
僅從定義上看,就可以清晰的分辨出了。
內連接:指連接結果僅包含符合連接條件的行,參與連接的兩個表都應該符合連接條件。也就是,返回2個表中完全符合條件的記錄,結果集中每個表的字段內容均來自各自的表。
外連接:連接結果不僅包含符合連接條件的行,同時也包含自身不符合條件的行。包括左外連接、右外連接和全外連接。也就是,返回2個表中完全符合條件的記錄,再加上2個表中各自的記錄,結果集中的字段只有一個表中有記錄時,另一個表中的字段均使用空值null填寫。
(2)兩表連接查詢時,選擇哪種查詢的依據
連接查詢是SQL查詢的核心,連接查詢的連接類型選擇依據實際需求。如果選擇不當,非但不能提高查詢效率,反而會帶來一些邏輯錯誤或者性能低下。
1、 查兩表關聯列相等的數據用內連接。
2、 Col_L是Col_R的子集時用右外連接。
3、 Col_R是Col_L的子集時用左外連接。
4、 Col_R和Col_L彼此有交集但彼此互不為子集時候用全外。
5、 求差操作的時候用聯合查詢。
多個表查詢的時候,這些不同的連接類型可以寫到一塊。例如:
SELECT T1.C1,T2.CX,T3.CY
FROM TAB1 T1
INNER JOIN TAB2 T2 ON (T1.C1=T2.C2)
INNER JOIN TAB3 T3 ON (T1.C1=T2.C3)
LEFT OUTER JOIN TAB4 ON(T2.C2=T3.C3);
WHERE T1.X >T3.Y;
上面這個SQL查詢是多表連接的一個示范。
參考文章
SQL語句 之 數據查詢(二)多表查詢-----------------數據查詢的重點 難點
數據庫的內連接和外連接有什么區別?,Daicx19。