一.where和on的區別
數據庫在通過連接兩張或多張表來返回記錄時,都會生成一張中間的臨時表,然后再將這張臨時表返回給用戶。
在使用
left
jion時,
on
和
where
條件的區別如下:
1、
on
條件是在生成臨時表時使用的條件,它不管
on
中的條件是否為真,都會返回左邊表中的記錄。
2、
where
條件是在臨時表生成好后,再對臨時表進行過濾的條件。這時已經沒有
left
join
的含義(必須返回左邊表的記錄)了,條件不為真的就全部過濾掉。
假設有兩張表:
表
1
:tab1
id size
1
10
2
20
3
30
表
2
:tab2
size name
10
AAA
20
BBB
20
CCC
兩條SQL:
1
、select * from tab1 left join tab2 on tab1.size = tab2.size where tab2.name=
'AAA'
2
、select * from tab1 left join tab2 on tab1.size = tab2.size and tab2.name=
'AAA'
第一條SQL的過程:
1
、中間表
on條件:
tab1.size = tab2.size
tab1.id tab1.size tab2.size tab2.name
1
10
10
AAA
2
20
20
BBB
2
20
20
CCC
3
30
(
null
) (
null
)
2
、再對中間表過濾
where 條件:
tab2.name=
'AAA'
tab1.id tab1.size tab2.size tab2.name
1
10
10
AAA
第二條SQL的過程:
1
、中間表
on條件:
tab1.size = tab2.size and tab2.name=
'AAA'
(條件不為真也會返回左表中的記錄) tab1.id tab1.size tab2.size tab2.name
1
10
10
AAA
2
20
(
null
) (
null
)
3
30
(
null
) (
null
)
其實以上結果的關鍵原因就是
left
join
,
right
join
,
full
join
的特殊性,
不管
on
上的條件是否為真都會返回
left
或
right
表中的記錄,
full
則具有
left
和
right
的特性的並集。
而
inner
jion沒這個特殊性,則條件放在
on
中和
where
中,返回的結果集是相同的。
在說區別之前,得先介紹GROUP BY這個子句,而在說GROUP子句前,又得先說說“聚合函數”——SQL語言中一種特殊的函數。例如SUM, COUNT, MAX, AVG等。這些函數和其它函數的根本區別就是它們一般作用在多條記錄上。
如:
SELECT SUM(population) FROM vv_t_bbc ;
這里的SUM作用在所有返回記錄的population字段上,結果就是該查詢只返回一個結果,即所有國家的總人口數。
而通過使用GROUP BY 子句,可以讓SUM 和 COUNT 這些函數對屬於一組的數據起作用。當你指定 GROUP BY region 時,只有屬於同一個region(地區)的一組數據才將返回一行值,也就是說,表中所有除region(地區)外的字段,只能通過 SUM, COUNT等聚合函數運算后返回一個值。
下面再說說“HAVING”和“WHERE”:
HAVING子句可以讓我們篩選成組后的各組數據,WHERE子句在聚合前先篩選記錄.也就是說作用在GROUP BY 子句和HAVING子句前;而 HAVING子句在聚合后對組記錄進行篩選。
讓我們還是通過具體的實例來理解GROUP BY 和 HAVING 子句:
SQL實例:
一、顯示每個地區的總人口數和總面積:
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
先以region把返回記錄分成多個組,這就是GROUP BY的字面含義。分完組后,然后用聚合函數對每組中的不同字段(一或多條記錄)作運算。
二、顯示每個地區的總人口數和總面積.僅顯示那些人口數量超過1000000的地區。
SELECT region, SUM(population), SUM(area)
FROM bbc
GROUP BY region
HAVING SUM(population)>1000000
[注] 在這里,我們不能用where來篩選超過1000000的地區,因為表中不存在這樣一條記錄。
相反,HAVING子句可以讓我們篩選成組后的各組數據.
ps:如果想根據sum后的字段進行排序可以在后面加上:order by sum(population) desc/asc
