SQL Server 執行計划中的掃描方式舉例說明
原文地址:http://www.cnblogs.com/zihunqingxin/p/3201155.html
1、執行計划使用方式
選中需要執行的語句,點擊Ctrl+L執行
2、示例
student表,id,name,address
id上建立聚集索引
Name建索引
address無索引
3、區別
1. 【Table Scan】:遍歷整個表,查找所有匹配的記錄行。這個操作將會一行一行的檢查,當然,效率也是最差的。
以無索引字段為條件,按存放順序一個個查,where address='123'
2. 【Index Scan】:根據索引,從表中過濾出來一部分記錄,再查找所有匹配的記錄行,顯然比第一種方式的查找范圍要小,因此比【Table Scan】要快。
多重條件,有索引列+無索引列,先從索引列找出范圍,再遍歷這個范圍匹配無索引列。即索引+表掃描
where name='cui' and address='123'
3. 【Index Seek】:根據索引,定位(獲取)記錄的存放位置,然后取得記錄,因此,比起前二種方式會更快。
有索引的單獨查詢。通過索引找到位置,再找數據。where name='cui'
4. 【Clustered Index Scan】:和【Table Scan】一樣。
注意:不要以為這里有個Index,就認為不一樣了。其實它的意思是說:按聚集索引來逐行掃描每一行記錄,因為記錄就是按聚集索引來順序存放的。而【Table Scan】只是說:要掃描的表沒有聚集索引而已,因此這二個操作本質上也是一樣的。
5. 【Clustered Index Seek】:直接根據聚集索引獲取記錄,最快!
where id=1; 聚集索引存的就是位置。(不是說就是位置,應該說位置保存的是整行數據的所有列的值,而非聚集只保存着有非聚集索引的那個字段)比3少一步
沒索引或者沒主鍵自動生成的索引就直接全表掃描
如果使用索引查找,是索引順序和物理存儲順序的結合,如果僅僅讀取index(比如覆蓋索引),就是index的順序, 影響因素會隨着環境的差異而不一樣。 總的來說,會與以下因素有關:索引方式物理位置存儲引擎
Select語句完整的執行順序:
SQL Select語句完整的執行順序:
1、 from子句組裝來自不同數據源的數據;
2、where子句基於指定的條件對記錄行進行篩選;
3、group by子句將數據划分為多個分組;
4、使用聚集函數進行計算;
5、使用having子句篩選分組;
6、計算所有的表達式;
7、 使用order by對結果集進行排序
性能優化技巧
Oracle SQL 性能優化技巧
1.選用適合的ORACLE優化器
ORACLE的優化器共有3種
A、RULE (基於規則) b、COST (基於成本) c、CHOOSE (選擇性)
設置缺省的優化器,可以通過對init.ora文件中OPTIMIZER_MODE參數的各種聲明,如RULE,COST,CHOOSE,ALL_ROWS,FIRST_ROWS 。你當然也在SQL句級或是會話(session)級對其進行覆蓋。
為了使用基於成本的優化器(CBO, Cost-Based Optimizer) , 你必須經常運行analyze 命令,以增加數據庫中的對象統計信息(object statistics)的准確性。
如果數據庫的優化器模式設置為選擇性(CHOOSE),那么實際的優化器模式將和是否運行過analyze命令有關。如果table已經被analyze過, 優化器模式將自動成為CBO , 反之,數據庫將采用RULE形式的優化器。
在缺省情況下,ORACLE采用CHOOSE優化器,為了避免那些不必要的全表掃描(full table scan) ,你必須盡量避免使用CHOOSE優化器,而直接采用基於規則或者基於成本的優化器。
2.訪問Table的方式
ORACLE 采用兩種訪問表中記錄的方式:
A、 全表掃描
全表掃描就是順序地訪問表中每條記錄。ORACLE采用一次讀入多個數據塊(database block)的方式優化全表掃描。
B、 通過ROWID訪問表
你可以采用基於ROWID的訪問方式情況,提高訪問表的效率, ROWID包含了表中記錄的物理位置信息。ORACLE采用索引(INDEX)實現了數據和存放數據的物理位置(ROWID)之間的聯系。通常索引提供了 快速訪問ROWID的方法,因此那些基於索引列的查詢就可以得到性能上的提高。
3.共享SQL語句
為了不重復解析相同的SQL語句,在第一次解析之后,ORACLE將SQL語句存放在內存中。這塊位於系統全局區域SGA(system global area)的共享池(shared buffer pool)中的內存可以被所有的數據庫用戶共享。因此,當你執行一個SQL語句(有時被稱為一個游標)時,如果它和之前的執行過的語句完全相同, ORACLE就能很快獲得已經被解析的語句以及最好的執行路徑。ORACLE的這個功能大大地提高了SQL的執行性能並節省了內存的使用。
可惜的是ORACLE只對簡單的表提供高速緩沖(cache buffering),這個功能並不適用於多表連接查詢。
數據庫管理員必須在init.ora中為這個區域設置合適的參數,當這個內存區域越大,就可以保留更多的語句,當然被共享的可能性也就越大了。
當你向ORACLE提交一個SQL語句,ORACLE會首先在這塊內存中查找相同的語句。這里需要注明的是,ORACLE對兩者采取的是一種嚴格匹配,要達成共享,SQL語句必須完全相同(包括空格,換行等)。
數據庫管理員必須在init.ora中為這個區域設置合適的參數,當這個內存區域越大,就可以保留更多的語句,當然被共享的可能性也就越大了。
共享的語句必須滿足三個條件:
A、 字符級的比較:當前被執行的語句和共享池中的語句必須完全相同。
B、 兩個語句所指的對象必須完全相同:
C、兩個SQL語句中必須使用相同的名字的綁定變量(bind variables)。
4.選擇最有效率的表名順序(只在基於規則的優化器中有效)
ORACLE的解析器按照從右到左的順序處理FROM子句中的表名,因此FROM子句中寫在最后的表(基礎表 driving table)將被最先處理。在FROM子句中包含多個表的情況下,你必須選擇記錄條數最少的表作為基礎表。當ORACLE處理多個表時,會運用排序及合並 的方式連接它們。首先,掃描第一個表(FROM子句中最后的那個表)並對記錄進行派序,然后掃描第二個表(FROM子句中最后第二個表),最后將所有從第 二個表中檢索出的記錄與第一個表中合適記錄進行合並。
如果有3個以上的表連接查詢,那就需要選擇交叉表(intersection table)作為基礎表,交叉表是指那個被其他表所引用的表。
5.WHERE子句中的連接順序
ORACLE采用自下而上的順序解析WHERE子句,根據這個原理,表之間的連接必須寫在其他WHERE條件之前,那些可以過濾掉最大數量記錄的條件必須寫在WHERE子句的末尾。
6.SELECT子句中避免使用 ' * '
當你想在SELECT子句中列出所有的COLUMN時,使用動態SQL列引用 '*' 是一個方便的方法。不幸的是,這是一個非常低效的方法。實際上,ORACLE在解析的過程中,會將'*' 依次轉換成所有的列名,這個工作是通過查詢數據字典完成的,這意味着將耗費更多的時間。
7.減少訪問數據庫的次數
當執行每條SQL語句時,ORACLE在內部執行了許多工作:解析SQL語句,估算索引的利用率,綁定變量,讀數據塊等等。由此可見,減少訪問數據庫的次數,就能實際上減少ORACLE的工作量。
8.使用DECODE函數來減少處理時間
使用DECODE函數可以避免重復掃描相同記錄或重復連接相同的表。
9.整合簡單,無關聯的數據庫訪問
如果你有幾個簡單的數據庫查詢語句,你可以把它們整合到一個查詢中(即使它們之間沒有關系)
10.刪除重復記錄
11.用TRUNCATE替代DELETE
當刪除表中的記錄時,在通常情況下,回滾段(rollback segments ) 用來存放可以被恢復的信息。如果你沒有COMMIT事務,ORACLE會將數據恢復到刪除之前的狀態(准確地說是恢復到執行刪除命令之前的狀況)。
而當運用TRUNCATE時,回滾段不再存放任何可被恢復的信息。當命令運行后,數據不能被恢復。因此很少的資源被調用,執行時間也會很短。
12.盡量多使用COMMIT
只要有可能,在程序中盡量多使用COMMIT,這樣程序的性能得到提高,需求也會因為COMMIT所釋放的資源而減少
COMMIT所釋放的資源:
A、 回滾段上用於恢復數據的信息。
B、被程序語句獲得的鎖。
C、 redo log buffer 中的空間。
D、ORACLE為管理上述3種資源中的內部花費。
13.計算記錄條數
和一般的觀點相反,count(*) 比count(1)稍快,當然如果可以通過索引檢索,對索引列的計數仍舊是最快的。例如 COUNT(EMPNO)
14.用Where子句替換HAVING子句
避免使用HAVING子句,HAVING 只會在檢索出所有記錄之后才對結果集進行過濾。這個處理需要排序,總計等操作。如果能通過WHERE子句限制記錄的數目,那就能減少這方面的開銷。
15.減少對表的查詢
在含有子查詢的SQL語句中,要特別注意減少對表的查詢。
16.通過內部函數提高SQL效率。
17.使用表的別名(Alias)
當在SQL語句中連接多個表時,請使用表的別名並把別名前綴於每個Column上。這樣一來,就可以減少解析的時間並減少那些由Column歧義引起的語法錯誤。
18.用EXISTS替代IN
在許多基於基礎表的查詢中,為了滿足一個條件,往往需要對另一個表進行聯接。在這種情況下,使用EXISTS(或NOT EXISTS)通常將提高查詢的效率。
19.用NOT EXISTS替代NOT IN
在子查詢中,NOT IN子句將執行一個內部的排序和合並。無論在哪種情況下,NOT IN都是最低效的 (因為它對子查詢中的表執行了一個全表遍歷)。為了避免使用NOT IN ,我們可以把它改寫成外連接(Outer Joins)或NOT EXISTS。
20.用表連接替換EXISTS
通常來說 ,采用表連接的方式比EXISTS更有效率
21.用EXISTS替換DISTINCT
當提交一個包含一對多表信息(比如部門表和雇員表)的查詢時,避免在SELECT子句中使用DISTINCT。一般可以考慮用EXIST替換