大綱:on是在生成連接表的起作用,where是生成連接表之后對連接表再進行過濾
當使用left join時,無論on的條件是否滿足,都會返回左表的所有記錄,對於滿足的條件的記錄,兩個表對應的記錄會連接起來,對於不滿足條件的記錄,那右表字段全部是null;
當使用right join時,類似,只不過是全部返回右表的所有記錄
當使用inner join時,功能與where完全相同。
案例實踐:
數據庫在通過連接兩張或多張表來返回記錄時,都會生成一張中間的臨時表,然后再將這張臨時表返回給用戶。
在使用left join時,on和where條件的區別如下:
1、on條件是在生成臨時表時使用的條件,它不管on中的條件是否為真,都會返回左邊表中的記錄。
2、where條件是在臨時表生成好后,再對臨時表進行過濾的條件。這時已經沒有left join的含義(必須返回左邊表的記錄)了,條件不為真的就全部過濾掉。
假設有兩張表:
表1:tab2
id | size |
1 | 10 |
2 | 20 |
3 | 30 |
表2:tab2
size | name |
10 | AAA |
20 | BBB |
30 | CCC |
兩條SQL:
1、select * from tab1 left join tab2 on (tab1.size = tab2.size) where tab2.name='AAA'
2、select * from tab1 left join tab2 on (tab1.size = tab2.size and tab2.name=‘AAA’)
第一條SQL的過程:
1、中間表on條件:tab1.size = tab2.size
tab1.id | tab1.size | tab2.size | tab2.name |
1
|
10
|
10
|
AAA
|
2
|
20
|
20
|
BBB
|
2
|
20
|
20
|
CCC
|
3
|
30
|
(null)
|
(null)
|
2、再對中間表過濾where條件:tab2.name=‘AAA’
tab1.id | tab1.size | tab2.size | tab2.name |
1
|
10
|
10
|
AAA
|
第二條SQL的過程:
1、中間表on條件:tab1.size = tab2.size and tab2.name = ‘AAA’
tab1.id | tab1.size | tab2.size | tab2.name |
1
|
10
|
10
|
AAA
|
2
|
20
|
(null)
|
(null)
|
3
|
30
|
(null)
|
(null)
|
以上結果的關鍵原因是left join,right join,full join的特殊性,不管on上的條件是否為真都會返回left或right表中的記錄,full則具有left和right的特性的並集,而inner jion沒有這個特殊性,則條件放在on中和where中,返回的結果集是相同的。
注:所有的連接條件必需要放在ON后面,不然前面的所有LEFT和RIGHT關聯將作為擺設,而不起任何作用。
on、where、having的區別
on、where、having這三個都可以加條件的子句中,on是最先執行,where次之,having最后。有時候如果這先后順序不影響中間結果的話,那最終結果是相同的。但因為on是先把不符合條件的記錄過濾后才進行統計,它就可以減少中間運算要處理的數據,按理說應該速度是最快的。
根據上面的分析,可以知道where也應該比having快點的,因為它過濾數據后才進行sum,所以having是最慢的。但也不是說having沒用,因為有時在步驟3還沒出來都不知道哪個記錄才符合要求時,就要用having了。
在兩個表聯接時才用on的,所以在一個表的時候,就剩下where跟having比較了。在這單表查詢統計的情況下,如果要過濾的條件沒有涉及到要計算字段,那它們的結果是一樣的,只是where可以使用rushmore技術,而having就不能,在速度上后者要慢。
如果要涉及到計算的字段,就表示在沒計算之前,這字段的值是不確定的,根據之前的執行流程,where的作用時間是在計算之前就完成的,而having就是在計算后才起作用的,所以在這種情況下兩者的結果會不用。
在多表聯接查詢時,on比where更早起作用。系統首先根據各個表之間的聯接條件,把多個表合成一個臨時表后,再由where進行過濾,然后再計算,計算完后再由having進行過濾。由此可見,要想過濾條件起到正確的作用,首先要明白這個條件應該在什么時候起作用,然后再i決定放在哪里。