SQL連接查詢的執行順序?


sql和mysql執行順序,發現內部機制是一樣的。最大區別是在別名的引用上。

一、sql執行順序

(1)from
(2)on
(3)join
(4)where
(5)group by(開始使用select中的別名,后面的語句中都可以使用)
(6)avg,sum....
(7)having
(8)select
(9)distinct
(10)order by
(11)limit

從這個順序中我們不難發現,所有的 查詢語句都是從from開始執行的,在執行過程中,每個步驟都會為下一個步驟生成一個虛擬表,這個虛擬表將作為下一個執行步驟的輸入。

第一步:首先對from子句中的前兩個表執行一個笛卡爾乘積,此時生成虛擬表 vt1(選擇相對小的表做基礎表)

第二步:接下來便是應用on篩選器,on 中的邏輯表達式將應用到 vt1 中的各個行,篩選出滿足on邏輯表達式的行,生成虛擬表 vt2

第三步:如果是outer join 那么這一步就將添加外部行,left outer jion 就把左表在第二步中過濾的添加進來,如果是right outer join 那么就將右表在第二步中過濾掉的行添加進來,這樣生成虛擬表 vt3

第四步:如果 from 子句中的表數目多余兩個表,那么就將vt3和第三個表連接從而計算笛卡爾乘積,生成虛擬表,該過程就是一個重復1-3的步驟,最終得到一個新的虛擬表 vt3。

第五步:應用where篩選器,對上一步生產的虛擬表引用where篩選器,生成虛擬表vt4,在這有個比較重要的細節不得不說一下,對於包含outer join子句的查詢,就有一個讓人感到困惑的問題,到底在on篩選器還是用where篩選器指定邏輯表達式呢?on和where的最大區別在於,如果在on應用邏輯表達式那么在第三步outer join中還可以把移除的行再次添加回來,而where的移除的最終的。舉個簡單的例子,有一個學生表(班級,姓名)和一個成績表(姓名,成績),我現在需要返回一個x班級的全體同學的成績,但是這個班級有幾個學生缺考,也就是說在成績表中沒有記錄。為了得到我們預期的結果我們就需要在on子句指定學生和成績表的關系(學生.姓名=成績.姓名)那么我們是否發現在執行第二步的時候,對於沒有參加考試的學生記錄就不會出現在vt2中,因為他們被on的邏輯表達式過濾掉了,但是我們用left outer join就可以把左表(學生)中沒有參加考試的學生找回來,因為我們想返回的是x班級的所有學生,如果在on中應用學生.班級='x'的話,left outer join會把x班級的所有學生記錄找回(感謝網友康欽謀__康欽苗的指正),所以只能在where篩選器中應用學生.班級='x' 因為它的過濾是最終的。

第六步:group by 子句將中的唯一的值組合成為一組,得到虛擬表vt5。如果應用了group by,那么后面的所有步驟都只能得到的vt5的列或者是聚合函數(count、sum、avg等)。原因在於最終的結果集中只為每個組包含一行。這一點請牢記。

第七步:應用cube或者rollup選項,為vt5生成超組,生成vt6

第八步:應用having篩選器,生成vt7。having篩選器是第一個也是為唯一一個應用到已分組數據的篩選器

第九步:處理select子句。將vt7中的在select中出現的列篩選出來。生成vt8

第十步:應用distinct子句,vt8中移除相同的行,生成vt9。事實上如果應用了group by子句那么distinct是多余的,原因同樣在於,分組的時候是將列中唯一的值分成一組,同時只為每一組返回一行記錄,那么所以的記錄都將是不相同的。

第十一步:應用order by子句。按照order_by_condition排序vt9,此時返回的一個游標,而不是虛擬表。sql是基於集合的理論的,集合不會預先對他的行排序,它只是成員的邏輯集合,成員的順序是無關緊要的。對表進行排序的查詢可以返回一個對象,這個對象包含特定的物理順序的邏輯組織。這個對象就叫游標。正因為返回值是游標,那么使用order by 子句查詢不能應用於表表達式。排序是很需要成本的,除非你必須要排序,否則最好不要指定order by,最后,在這一步中是第一個也是唯一一個可以使用select列表中別名的步驟。

第十二步:應用top選項。此時才返回結果給請求者即用戶。

參考:https://blog.csdn.net/u014044812/article/details/51004754


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM