SQL Server 執行計划中的掃描方式舉例說明 和 sql掃描順序(index scan等) 性能優化技巧


 

SQL Server 執行計划中的掃描方式舉例說明

原文地址:http://www.cnblogs.com/zihunqingxin/p/3201155.html

1、執行計划使用方式
選中需要執行的語句,點擊Ctrl+L執行

2、示例
student表,id,name,address
id上建立聚集索引
Name建索引
address無索引

3、區別
1. 【Table Scan】:遍歷整個表,查找所有匹配的記錄行。這個操作將會一行一行的檢查,當然,效率也是最差的。
以無索引字段為條件,按存放順序一個個查,where address='123'


2. 【Index Scan】:根據索引,從表中過濾出來一部分記錄,再查找所有匹配的記錄行,顯然比第一種方式的查找范圍要小,因此比【Table Scan】要快。
多重條件,有索引列+無索引列,先從索引列找出范圍,再遍歷這個范圍匹配無索引列。即索引+表掃描
where name='cui' and address='123'

3. 【Index Seek】:根據索引,定位(獲取)記錄的存放位置,然后取得記錄,因此,比起前二種方式會更快。
有索引的單獨查詢。通過索引找到位置,再找數據。where name='cui'

4. 【Clustered Index Scan】:和【Table Scan】一樣。
注意:不要以為這里有個Index,就認為不一樣了。其實它的意思是說:按聚集索引來逐行掃描每一行記錄,因為記錄就是按聚集索引來順序存放的。而【Table Scan】只是說:要掃描的表沒有聚集索引而已,因此這二個操作本質上也是一樣的。

5. 【Clustered Index Seek】:直接根據聚集索引獲取記錄,最快!
where id=1; 聚集索引存的就是位置。(不是說就是位置,應該說位置保存的是整行數據的所有列的值,而非聚集只保存着有非聚集索引的那個字段)比3少一步

 

沒索引或者沒主鍵自動生成的索引就直接全表掃描

如果使用索引查找,是索引順序和物理存儲順序的結合,如果僅僅讀取index(比如覆蓋索引),就是index的順序,
影響因素會隨着環境的差異而不一樣。
總的來說,會與以下因素有關:索引方式物理位置存儲引擎


Select語句完整的執行順序:

SQL Select語句完整的執行順序:

1、 from子句組裝來自不同數據源的數據;
2、where子句基於指定的條件對記錄行進行篩選;
3、group by子句將數據划分為多個分組;
4、使用聚集函數進行計算;
5、使用having子句篩選分組;
6、計算所有的表達式;
7、 使用order by對結果集進行排序

 

性能優化技巧

Oracle SQL 性能優化技巧

1.選用適合的ORACLE優化器
     ORACLE的優化器共有3種

     A、RULE (基於規則) b、COST (基於成本) c、CHOOSE (選擇性)

     設置缺省的優化器,可以通過對init.ora文件中OPTIMIZER_MODE參數的各種聲明,如RULE,COST,CHOOSE,ALL_ROWS,FIRST_ROWS 。你當然也在SQL句級或是會話(session)級對其進行覆蓋。

     為了使用基於成本的優化器(CBO, Cost-Based Optimizer) , 你必須經常運行analyze 命令,以增加數據庫中的對象統計信息(object statistics)的准確性。

     如果數據庫的優化器模式設置為選擇性(CHOOSE),那么實際的優化器模式將和是否運行過analyze命令有關。如果table已經被analyze過, 優化器模式將自動成為CBO , 反之,數據庫將采用RULE形式的優化器。

在缺省情況下,ORACLE采用CHOOSE優化器,為了避免那些不必要的全表掃描(full table scan) ,你必須盡量避免使用CHOOSE優化器,而直接采用基於規則或者基於成本的優化器。

2.訪問Table的方式
     ORACLE 采用兩種訪問表中記錄的方式:
     A、 全表掃描
          全表掃描就是順序地訪問表中每條記錄。ORACLE采用一次讀入多個數據塊(database block)的方式優化全表掃描。
     B、 通過ROWID訪問表
          你可以采用基於ROWID的訪問方式情況,提高訪問表的效率, ROWID包含了表中記錄的物理位置信息。ORACLE采用索引(INDEX)實現了數據和存放數據的物理位置(ROWID)之間的聯系。通常索引提供了 快速訪問ROWID的方法,因此那些基於索引列的查詢就可以得到性能上的提高。

3.共享SQL語句
     為了不重復解析相同的SQL語句,在第一次解析之后,ORACLE將SQL語句存放在內存中。這塊位於系統全局區域SGA(system global area)的共享池(shared buffer pool)中的內存可以被所有的數據庫用戶共享。因此,當你執行一個SQL語句(有時被稱為一個游標)時,如果它和之前的執行過的語句完全相同, ORACLE就能很快獲得已經被解析的語句以及最好的執行路徑。ORACLE的這個功能大大地提高了SQL的執行性能並節省了內存的使用。

     可惜的是ORACLE只對簡單的表提供高速緩沖(cache buffering),這個功能並不適用於多表連接查詢。

     數據庫管理員必須在init.ora中為這個區域設置合適的參數,當這個內存區域越大,就可以保留更多的語句,當然被共享的可能性也就越大了。

     當你向ORACLE提交一個SQL語句,ORACLE會首先在這塊內存中查找相同的語句。這里需要注明的是,ORACLE對兩者采取的是一種嚴格匹配,要達成共享,SQL語句必須完全相同(包括空格,換行等)。

     數據庫管理員必須在init.ora中為這個區域設置合適的參數,當這個內存區域越大,就可以保留更多的語句,當然被共享的可能性也就越大了。

     共享的語句必須滿足三個條件:

     A、 字符級的比較:當前被執行的語句和共享池中的語句必須完全相同。

     B、 兩個語句所指的對象必須完全相同:

     C、兩個SQL語句中必須使用相同的名字的綁定變量(bind variables)。

4.選擇最有效率的表名順序(只在基於規則的優化器中有效)
     ORACLE的解析器按照從右到左的順序處理FROM子句中的表名,因此FROM子句中寫在最后的表(基礎表 driving table)將被最先處理。在FROM子句中包含多個表的情況下,你必須選擇記錄條數最少的表作為基礎表。當ORACLE處理多個表時,會運用排序及合並 的方式連接它們。首先,掃描第一個表(FROM子句中最后的那個表)並對記錄進行派序,然后掃描第二個表(FROM子句中最后第二個表),最后將所有從第 二個表中檢索出的記錄與第一個表中合適記錄進行合並。

     如果有3個以上的表連接查詢,那就需要選擇交叉表(intersection table)作為基礎表,交叉表是指那個被其他表所引用的表。

5.WHERE子句中的連接順序
     ORACLE采用自下而上的順序解析WHERE子句,根據這個原理,表之間的連接必須寫在其他WHERE條件之前,那些可以過濾掉最大數量記錄的條件必須寫在WHERE子句的末尾。

6.SELECT子句中避免使用 ' * '
     當你想在SELECT子句中列出所有的COLUMN時,使用動態SQL列引用 '*' 是一個方便的方法。不幸的是,這是一個非常低效的方法。實際上,ORACLE在解析的過程中,會將'*' 依次轉換成所有的列名,這個工作是通過查詢數據字典完成的,這意味着將耗費更多的時間。

7.減少訪問數據庫的次數
     當執行每條SQL語句時,ORACLE在內部執行了許多工作:解析SQL語句,估算索引的利用率,綁定變量,讀數據塊等等。由此可見,減少訪問數據庫的次數,就能實際上減少ORACLE的工作量。

8.使用DECODE函數來減少處理時間
     使用DECODE函數可以避免重復掃描相同記錄或重復連接相同的表。

9.整合簡單,無關聯的數據庫訪問
     如果你有幾個簡單的數據庫查詢語句,你可以把它們整合到一個查詢中(即使它們之間沒有關系)

10.刪除重復記錄

11.用TRUNCATE替代DELETE
     當刪除表中的記錄時,在通常情況下,回滾段(rollback segments ) 用來存放可以被恢復的信息。如果你沒有COMMIT事務,ORACLE會將數據恢復到刪除之前的狀態(准確地說是恢復到執行刪除命令之前的狀況)。

     而當運用TRUNCATE時,回滾段不再存放任何可被恢復的信息。當命令運行后,數據不能被恢復。因此很少的資源被調用,執行時間也會很短。

12.盡量多使用COMMIT
     只要有可能,在程序中盡量多使用COMMIT,這樣程序的性能得到提高,需求也會因為COMMIT所釋放的資源而減少

     COMMIT所釋放的資源:

     A、 回滾段上用於恢復數據的信息。

     B、被程序語句獲得的鎖。

     C、 redo log buffer 中的空間。

     D、ORACLE為管理上述3種資源中的內部花費。

13.計算記錄條數
     和一般的觀點相反,count(*) 比count(1)稍快,當然如果可以通過索引檢索,對索引列的計數仍舊是最快的。例如 COUNT(EMPNO)

14.用Where子句替換HAVING子句
     避免使用HAVING子句,HAVING 只會在檢索出所有記錄之后才對結果集進行過濾。這個處理需要排序,總計等操作。如果能通過WHERE子句限制記錄的數目,那就能減少這方面的開銷。

15.減少對表的查詢
     在含有子查詢的SQL語句中,要特別注意減少對表的查詢。

16.通過內部函數提高SQL效率。

17.使用表的別名(Alias)
     當在SQL語句中連接多個表時,請使用表的別名並把別名前綴於每個Column上。這樣一來,就可以減少解析的時間並減少那些由Column歧義引起的語法錯誤。

18.用EXISTS替代IN
     在許多基於基礎表的查詢中,為了滿足一個條件,往往需要對另一個表進行聯接。在這種情況下,使用EXISTS(或NOT EXISTS)通常將提高查詢的效率。

19.用NOT EXISTS替代NOT IN
     在子查詢中,NOT IN子句將執行一個內部的排序和合並。無論在哪種情況下,NOT IN都是最低效的 (因為它對子查詢中的表執行了一個全表遍歷)。為了避免使用NOT IN ,我們可以把它改寫成外連接(Outer Joins)或NOT EXISTS。

20.用表連接替換EXISTS
     通常來說 ,采用表連接的方式比EXISTS更有效率

21.用EXISTS替換DISTINCT
     當提交一個包含一對多表信息(比如部門表和雇員表)的查詢時,避免在SELECT子句中使用DISTINCT。一般可以考慮用EXIST替換


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM