1.基本用法
IN:后面的子查詢 是返回結果集的,換句話說執行次序和Exists()不一樣.子查詢先產生結果集,然后主查詢再去結果集里去找符合要求的字段列表去.符合要求的輸出,反之則不輸出.
Exists:后面的子查詢被稱做相關子查詢, 他是不返回列表的值的.只是返回一個ture或false的結果(這也是為什么子查詢里是 "select 1 "的原因,當然也可以select任何東西) 其運行方式是先運行主查詢一次。再去子查詢里查詢與其對應的結果,如果是ture則輸出,反之則不輸出.再根據主查詢中的每一行去子查詢里去查詢。
2.運行過程
Exists執行順序如下:
1.首先執行一次外部查詢
2.對於外部查詢中的每一行分別執行一次子查詢,而且每次執行子查詢時都會引用外部查詢中當前行的值。
3.使用子查詢的結果來確定外部查詢的結果集。(如果外部查詢返回100行,SQL 就將執行101次查詢,一次執行外部查詢,然后為外部查詢返回的每一行執行一次子查詢。但實際上,SQL的查詢 優化器有可能會找到一種更好的方法來執行相關子查詢,而不需要實際執行101次查詢。)
IN的執行過程如下:
1.首先運行子查詢,獲取子結果集
2.主查詢再去結果集里去找符合要求的字段列表,.符合要求的輸出,反之則不輸出。
3.區別
3.1 IN和Exists
IN
是把外表和內表作hash 連接,而Exists是對外表作loop循環,每次loop循環再對內表進行查詢。一直以來認為Exists比IN
效率高的說法是不准確的。
如果查詢的兩個表大小相當,那么用IN
和Exists差別不大。
如果兩個表中一個較小,一個是大表,則子查詢表大的用Exists,子查詢表小的用IN
:
例如:表A(小表),表B(大表):
select
*
from
A
where
cc
in
(
select
cc
from
B)
效率低,用到了A表上cc列的索引;
select
*
from
A
where
exists(
select
cc
from
B
where
cc=A.cc)
效率高,用到了B表上cc列的索引。
相反的:
select
*
from
B
where
cc
in
(
select
cc
from
A)
效率高,用到了B表上cc列的索引;
select
*
from
B
where
exists(
select
cc
from
A
where
cc=B.cc)
效率低,用到了A表上cc列的索引。
3.2 not IN 和not Exists
not IN
和
not Exists
如果查詢語句使用了
not
in
那么內外表都進行全表掃描,沒有用到索引;而
not
extsts 的子查詢依然能用到表上的索引。所以無論那個表大,用
not Exists
都比
not IN
要快。
3.3 in
與 = 的區別
select
name
from
student
where
name
in
(
'A'
,
'S'
,
'D'
,
'F'
);
與
select
name
from
student
where
name
=
'A'
or
name
=
'S'
or
name
=
'D'
or
name
=
'F'
的結果是相同的。
