Oracle SQL語句性能優化方法大全


Oracle SQL語句性能優化方法大全

下面列舉一些工作中常常會碰到的Oracle的SQL語句優化方法:

1、SQL語句盡量用大寫的;

 因為oracle總是先解析SQL語句,把小寫的字母轉換成大寫的再執行。

 

2、選擇最有效率的表名順序(只在基於規則的優化器中有效):

ORACLE的解析器按照從右到左的順序處理FROM子句中的表名,FROM子句中寫在最后的表(基礎表 driving table)將被最先處理,在FROM子句中包含多個表的情況下,你必須選擇記錄條數最少的表作為基礎表。如果有3個以上的表連接查詢, 那就需要選擇交叉表(intersection table)作為基礎表, 交叉表是指那個被其他表所引用的表.

 

3、WHERE子句中的連接順序: 

 ORACLE采用自下而上的順序解析WHERE子句,根據這個原理,表之間的連接必須寫在其他

WHERE條件之前, 那些可以過濾掉最大數量記錄的條件必須寫在WHERE子句的末尾

 

4、使用表的別名: 

 當在SQL語句中連接多個表時, 盡量使用表的別名並把別名前綴於每個列上。這樣一來,

就可以減少解析的時間並減少那些由列歧義引起的語法錯誤。

 

5、SELECT子句中避免使用 ‘ * ‘:

ORACLE在解析的過程中, 會將'*' 依次轉換成所有的列名, 這個工作是通過查詢數據字典完成的, 這意味着將耗費更多的時間

 

6、使用DECODE函數來減少處理時間:

使用DECODE函數可以避免重復掃描相同記錄或重復連接相同的表.

 

7、整合簡單無關聯的數據庫訪問

如果有幾個簡單的數據庫查詢語句,你可以把它們整合到一個查詢中(即使它們之間沒有關系),以減少多於的數據庫IO開銷。

雖然采取這種方法,效率得到提高,但是程序的可讀性大大降低,所以還是要權衡之間的利弊。

 

8、使用where而非having

where語句是在group by 語句之前篩選出記錄,而having是在各種記錄都篩選之后再進行過濾,也就是說having子句是在數據庫中提取數據之后再篩選。因此盡量在篩選之前將數據使用where子句進行過濾,因此執行的順序應該如下

1使用where子句查找符合條件的數據

2使用group by子句對數據進行分組

3在group by分組的基礎上運行聚合函數計算每一組的值

 

9、用(UNION)UNION ALL替換OR (適用於索引列) 
通常情況下, 用UNION替換WHERE子句中的OR將會起到較好的效果. 對索引列使用OR將造成全表掃描. 
注意, 以上規則只針對多個索引列有效. 如果有column沒有被索引, 查詢效率可能會因為你沒有選擇OR

而降低. 在下面的例子中, LOC_ID 和REGION上都建有索引. 
如果你堅持要用OR, 那就需要返回記錄最少的索引列寫在最前面. 

代碼如下:
高效: SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 UNION ALL 
SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE REGION = “MELBOURNE” 
低效: SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 OR REGION = 
“MELBOURNE” 

 

10、用UNION-ALL 替換UNION ( 如果有可能的話): 
當SQL語句需要UNION兩個查詢結果集合時,這兩個結果集合會以UNION-ALL的方式被合並, 然后在輸出最
終結果前進行排序. 如果用UNION ALL替代UNION, 這樣排序就不是必要了. 效率就會因此得到提高. 需
要注意的是,UNION ALL 將重復輸出兩個結果集合中相同記錄. 因此各位還是要從業務需求分析使用
UNION ALL的可行性. UNION 將對結果集合排序,這個操作會使用到SORT_AREA_SIZE這塊內存. 對於這塊
內存的優化也是相當重要的. 

 

11、Order By語句加在索引列,最好是主鍵PK上。 

代碼如下:
SELECT DEPT_CODE FROM DEPT ORDER BY DEPT_TYPE(低效) 
SELECT DEPT_CODE FROM DEPT ORDER BY DEPT_CODE (高效)

 

12、避免使用耗費資源的操作: 
帶有DISTINCT,UNION,MINUS,INTERSECT的SQL語句會啟動SQL引擎 執行耗費資源的排序(SORT)功能. 
DISTINCT需要一次排序操作, 而其他的至少需要執行兩次排序. 通常, 帶有UNION, MINUS , INTERSECT
的SQL語句都可以用其他方式重寫. 如果你的數據庫的SORT_AREA_SIZE調配得好, 使用UNION , MINUS, 
INTERSECT也是可以考慮的, 畢竟它們的可讀性很強 

 

13、通常來說,如果語句能夠避免子查詢的 使用,就盡量不用子查詢。因為子查詢的開銷是相當昂貴的

 

14、用EXISTS替代IN

在許多基於基礎表的查詢中,為了滿足一個條件 ,往往需要對另一個表進行聯接。在這種情況下,使用EXISTS(或NOT EXISTS)通常將提高查詢的效率。

低效:

SELECT * FROM EMP (基礎表)
WHERE EMPNO > 0
AND DEPTNO IN (SELECT DEPTNO
FROM DEPT
WHERE LOC = ‘MELB’)
高效:

SELECT * FROM EMP (基礎表)
WHERE EMPNO > 0
AND EXISTS (SELECT ‘X’
FROM DEPT
WHERE DEPT.DEPTNO = EMP.DEPTNO
AND LOC = ‘MELB’)

 

15.用NOT EXISTS替代NOT IN

在子查詢中,NOT IN子句將執行一個內部的排序和合並,對子查詢中的表執行一個全表遍歷,因此是非常低效的。

為了避免使用NOT IN,可以把它改寫成外連接(Outer Joins)或者NOT EXISTS。

低效:

SELECT …
FROM EMP
WHERE DEPT_NO NOT IN (SELECT DEPT_NO
FROM DEPT
WHERE DEPT_CAT=’A’)
高效:

SELECT ….
FROM EMP E
WHERE NOT EXISTS (SELECT ‘X’
FROM DEPT D
WHERE D.DEPT_NO = E.DEPT_NO
AND DEPT_CAT = ‘A’)

 

16. 用表連接替換EXISTS

通常來說 ,采用表連接的方式比EXISTS更有效率 。

低效:

SELECT ENAME
FROM EMP E
WHERE EXISTS (SELECT ‘X’
FROM DEPT
WHERE DEPT_NO = E.DEPT_NO
AND DEPT_CAT = ‘A’)
高效:

SELECT ENAME
FROM DEPT D,EMP E
WHERE E.DEPT_NO = D.DEPT_NO
AND DEPT_CAT = ‘A’

 

17.用EXISTS替換DISTINCT 

當提交一個包含對多表信息(比如部門表和雇員表)的查詢時,避免在SELECT子句中使用DISTINCT。 一般可以考慮用EXIST替換。

EXISTS 使查詢更為迅速,因為RDBMS核心模塊將在子查詢的條件一旦滿足后,立刻返回結果。

低效:

SELECT DISTINCT DEPT_NO,DEPT_NAME
FROM DEPT D,EMP E
WHERE D.DEPT_NO = E.DEPT_NO
高效:

SELECT DEPT_NO,DEPT_NAME
FROM DEPT D
WHERE EXISTS (SELECT ‘X’
FROM EMP E
WHERE E.DEPT_NO = D.DEPT_NO;

 

18.用索引提高效率:

(1)特點

優點: 提高效率 主鍵的唯一性驗證

代價: 需要空間存儲 定期維護

重構索引: 

ALTER INDEX <INDEXNAME> REBUILD <TABLESPACENAME>;

 

(2)Oracle對索引有兩種訪問模式

索引唯一掃描 (Index Unique Scan)
索引范圍掃描 (index range scan)

 

(3)基礎表的選擇

基礎表(Driving Table)是指被最先訪問的表(通常以全表掃描的方式被訪問)。 根據優化器的不同,SQL語句中基礎表的選擇是不一樣的。
如果你使用的是CBO (COST BASED OPTIMIZER),優化器會檢查SQL語句中的每個表的物理大小,索引的狀態,然后選用花費最低的執行路徑。

(oracle 10g 及以后)
如果你用RBO (RULE BASED OPTIMIZER), 並且所有的連接條件都有索引對應,在這種情況下,基礎表就是FROM 子句中列在最后的那個表。

(oracle 10g以前)

 

(4)多個平等的索引

當SQL語句的執行路徑可以使用分布在多個表上的多個索引時,ORACLE會同時使用多個索引並在運行時對它們的記錄進行合並,檢索出僅對全部索引有效的記錄。
在ORACLE選擇執行路徑時,唯一性索引的等級高於非唯一性索引。然而這個規則只有當WHERE子句中索引列和常量比較才有效。如果索引列和其他表的索引類相比較。這種子句在優化器中的等級是非常低的。
如果不同表中兩個相同等級的索引將被引用,FROM子句中表的順序將決定哪個會被率先使用。 FROM子句中最后的表的索引將有最高的優先級。
如果相同表中兩個相同等級的索引將被引用,WHERE子句中最先被引用的索引將有最高的優先級。

 優先級要看CBO的要結婚表的數據來看。

(5)等式比較優先於范圍比較

DEPTNO上有一個非唯一性索引,EMP_CAT也有一個非唯一性索引。

SELECT ENAME
FROM EMP
WHERE DEPTNO > 20
AND EMP_CAT = ‘A’;
這里只有EMP_CAT索引被用到,然后所有的記錄將逐條與DEPTNO條件進行比較. 執行路徑如下:

TABLE ACCESS BY ROWID ON EMP

INDEX RANGE SCAN ON CAT_IDX

即使是唯一性索引,如果做范圍比較,其優先級也低於非唯一性索引的等式比較。

 

(6)相同的索引列不能互相比較,這將會啟用全表掃描。

不使用索引:

SELECT ACCOUNT_NAME, AMOUNT
FROM TRANSACTION
WHERE ACCOUNT_NAME = NVL(:ACC_NAME, ACCOUNT_NAME)
使用索引:

SELECT ACCOUNT_NAME,AMOUNT
from transaction
WHERE ACCOUNT_NAME LIKE NVL(:ACC_NAME, ’%’)

 

19.在java代碼中盡量少用連接符“+”連接字符串!

 

20.避免在索引列上使用NOT、<>、!= 通常, 

我們要避免在索引列上使用NOT, NOT會產生在和在索引列上使用函數相同的影響. 當ORACLE”遇到”NOT,他就會停止使用索引轉而執行全表掃描.

對索引列的使用最好就是 where 索引列 = 條件
!=將不使用索引,記住, 索引只能告訴你什么存在於表中, 而不能告訴你什么不存在於表中.。

 

21。避免在索引列上使用計算.

WHERE子句中,如果索引列是函數的一部分.優化器將不使用索引而使用全表掃描.
舉例:

低效:
SELECT … FROM DEPT WHERE SAL * 12 > 25000;

高效:
SELECT … FROM DEPT WHERE SAL > 25000/12;

 

22. 用>=替代>

高效:
SELECT * FROM EMP WHERE DEPTNO >=4


低效:
SELECT * FROM EMP WHERE DEPTNO >3
兩者的區別在於, 前者DBMS將直接跳到第一個DEPT等於4的記錄而后者將首先定位到DEPTNO=3的記錄並且向前掃描到第一個DEPT大於3的記錄.

 

23識別'低效執行'的SQL語句:

雖然目前各種關於SQL優化的圖形化工具層出不窮,但是寫出自己的SQL工具來解決問題始終是一個最好的方法:

SELECT EXECUTIONS , DISK_READS, BUFFER_GETS,
ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio,
ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,
SQL_TEXT
FROM V$SQLAREA
WHERE EXECUTIONS>0
AND BUFFER_GETS > 0
AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8

--and PARSING_SCHEMA_NAME = 'YYII_S6MISM'
ORDER BY 4 DESC;

 

24.避免在索引列上使用IS NULL和IS NOT NULL

避免在索引中使用任何可以為空的列,ORACLE將無法使用該索引.對於單列索引,如果列包含空值,索引中將不存在此記錄. 對於復合索引,如果每個列都為空,索引中同樣不存在此記錄. 如果至少有一個列不為空,則記錄存在於索引中.舉例: 如果唯一性索引建立在表的A列和B列上, 並且表中存在一條記錄的A,B值為(123,null) , ORACLE將不接受下一條具有相同A,B值(123,null)的記錄(插入). 然而如果所有的索引列都為空,ORACLE將認為整個鍵值為空而空不等於空. 因此你可以插入1000 條具有相同鍵值的記錄,當然它們都是空! 因為空值不存在於索引列中,所以WHERE子句中對索引列進行空值比較將使ORACLE停用該索引.

低效: (索引失效)
SELECT * FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL;

高效: (索引有效)
SELECT  * FROM DEPARTMENT WHERE DEPT_CODE >=0;

 

25.避免改變索引列的類型.:

當比較不同數據類型的數據時, ORACLE自動對列進行簡單的類型轉換.
假設 EMPNO是一個數值類型的索引列.

SELECT … FROM EMP WHERE EMPNO = ‘123'
實際上,經過ORACLE類型轉換, 語句轉化為:

SELECT … FROM EMP WHERE EMPNO = TO_NUMBER(‘123')
幸運的是,類型轉換沒有發生在索引列上,索引的用途沒有被改變.
現在,假設EMP_TYPE是一個字符類型的索引列.

SELECT … FROM EMP WHERE EMP_TYPE = 123
這個語句被ORACLE轉換為:

select … from EMP WHERETO_NUMBER(EMP_TYPE)=123
因為內部發生的類型轉換, 這個索引將不會被用到! 為了避免ORACLE對你的SQL進行隱式的類型轉換, 最好把類型轉換用顯式表現出來. 注意當字符和數值比較時, ORACLE會優先轉換數值類型到字符類型

 

26.如果檢索數據量超過30%的表中記錄數.使用索引將沒有顯著的效率提高. 

b. 在特定情況下, 使用索引也許會比全表掃描慢, 但這是同一個數量級上的區別. 而通常情況下,使用索引比全表掃描要塊幾倍乃至幾千倍!

 

27.用Explain Plan分析SQL語句

EXPLAIN PLAN 是一個很好的分析SQL語句的工具, 它甚至可以在不執行SQL的情況下分析語句. 通過分析, 我們就可以知道ORACLE是怎么樣連接表, 使用什么方式掃描表(索引掃描或全表掃描)以及使用到的索引名稱。

 

28.對UNION的優化

由於UNION會對查詢結果進行排序,而且過濾重復記錄,因此其執行效率沒有UNION ALL高。 UNION操作會使用到SORT_AREA_SIZE內存塊,因此對這塊內存的優化也非常重要。

可以使用下面的SQL來查詢排序的消耗量 :

select *
from V$SYSSTAT
where name like 'sort%'

 

 

29.連接多個掃描

如果對一個列和一組有限的值進行比較,優化器可能執行多次掃描並對結果進行合並連接。

舉例:

SELECT *
FROM LODGING
WHERE MANAGER IN (‘BILL GATES’, ’KEN MULLER’)
優化器可能將它轉換成以下形式:

SELECT *
FROM LODGING
WHERE MANAGER = ‘BILL GATES’
OR MANAGER = ’KEN MULLER’

 

30.使用日期

當使用日期時,需要注意如果有超過5位小數加到日期上,這個日期會進到下一天!
select TO_DATE('20010101','yyyymmdd')+0.99999
from DUAL;
Returns:
02-1月 -01

select TO_DATE('20010101','yyyymmdd')+0.999995
from DUAL;
RETURNS:
02-1月 -01

 

31.使用顯示游標(CURSORS)

使用隱式的游標,將會執行兩次操作。第一次檢索記錄,第二次檢查TOO MANY ROWS 這個exception。而顯式游標不執行第二次操作。

 

32.優化EXPORT和IMPORT

使用較大的BUFFER(比如10MB , 10,240,000)可以提高EXPORT和IMPORT的速度.

ORACLE將盡可能地獲取你所指定的內存大小,即使在內存不滿足,也不會報錯.這個值至少要和表中最大的列相當,否則列值會被截斷.

譯者按:

可以肯定的是, 增加BUFFER會大大提高EXPORT , IMPORT的效率. (曾經碰到過一個CASE, 增加BUFFER后,IMPORT/EXPORT快了10倍!)

作者可能犯了一個錯誤: “這個值至少要和表中最大的列相當,否則列值會被截斷. “

其中最大的列也許是指最大的記錄大小.

 

33.分離表和索引

總是將你的表和索引建立在不同的表空間內(TABLESPACES)。
決不要將不屬於ORACLE內部系統的對象存放到SYSTEM表空間里。
確保數據表空間和索引表空間置於不同的硬盤上。

 

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM