Oracle SQL語句性能優化方法大全
下面列舉一些工作中常常會碰到的Oracle的SQL語句優化方法:
1、SQL語句盡量用大寫的;
因為oracle總是先解析SQL語句,把小寫的字母轉換成大寫的再執行。
2、選擇最有效率的表名順序(只在基於規則的優化器中有效):
ORACLE的解析器按照從右到左的順序處理FROM子句中的表名,FROM子句中寫在最后的表(基礎表 driving table)將被最先處理,在FROM子句中包含多個表的情況下,你必須選擇記錄條數最少的表作為基礎表。如果有3個以上的表連接查詢, 那就需要選擇交叉表(intersection table)作為基礎表, 交叉表是指那個被其他表所引用的表.
3、WHERE子句中的連接順序:
ORACLE采用自下而上的順序解析WHERE子句,根據這個原理,表之間的連接必須寫在其他
WHERE條件之前, 那些可以過濾掉最大數量記錄的條件必須寫在WHERE子句的末尾
4、使用表的別名:
當在SQL語句中連接多個表時, 盡量使用表的別名並把別名前綴於每個列上。這樣一來,
就可以減少解析的時間並減少那些由列歧義引起的語法錯誤。
5、SELECT子句中避免使用 ‘ * ‘:
ORACLE在解析的過程中, 會將'*' 依次轉換成所有的列名, 這個工作是通過查詢數據字典完成的, 這意味着將耗費更多的時間
6、使用DECODE函數來減少處理時間:
使用DECODE函數可以避免重復掃描相同記錄或重復連接相同的表.
7、整合簡單無關聯的數據庫訪問
如果有幾個簡單的數據庫查詢語句,你可以把它們整合到一個查詢中(即使它們之間沒有關系),以減少多於的數據庫IO開銷。
雖然采取這種方法,效率得到提高,但是程序的可讀性大大降低,所以還是要權衡之間的利弊。
8、使用where而非having
where語句是在group by 語句之前篩選出記錄,而having是在各種記錄都篩選之后再進行過濾,也就是說having子句是在數據庫中提取數據之后再篩選。因此盡量在篩選之前將數據使用where子句進行過濾,因此執行的順序應該如下
1使用where子句查找符合條件的數據
2使用group by子句對數據進行分組
3在group by分組的基礎上運行聚合函數計算每一組的值
9、用(UNION)UNION ALL替換OR (適用於索引列)
通常情況下, 用UNION替換WHERE子句中的OR將會起到較好的效果. 對索引列使用OR將造成全表掃描.
注意, 以上規則只針對多個索引列有效. 如果有column沒有被索引, 查詢效率可能會因為你沒有選擇OR
而降低. 在下面的例子中, LOC_ID 和REGION上都建有索引.
如果你堅持要用OR, 那就需要返回記錄最少的索引列寫在最前面.
代碼如下:
高效: SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 UNION ALL
SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE REGION = “MELBOURNE”
低效: SELECT LOC_ID , LOC_DESC , REGION FROM LOCATION WHERE LOC_ID = 10 OR REGION =
“MELBOURNE”
10、用UNION-ALL 替換UNION ( 如果有可能的話):
當SQL語句需要UNION兩個查詢結果集合時,這兩個結果集合會以UNION-ALL的方式被合並, 然后在輸出最
終結果前進行排序. 如果用UNION ALL替代UNION, 這樣排序就不是必要了. 效率就會因此得到提高. 需
要注意的是,UNION ALL 將重復輸出兩個結果集合中相同記錄. 因此各位還是要從業務需求分析使用
UNION ALL的可行性. UNION 將對結果集合排序,這個操作會使用到SORT_AREA_SIZE這塊內存. 對於這塊
內存的優化也是相當重要的.
11、Order By語句加在索引列,最好是主鍵PK上。
代碼如下:
SELECT DEPT_CODE FROM DEPT ORDER BY DEPT_TYPE(低效)
SELECT DEPT_CODE FROM DEPT ORDER BY DEPT_CODE (高效)
12、避免使用耗費資源的操作:
帶有DISTINCT,UNION,MINUS,INTERSECT的SQL語句會啟動SQL引擎 執行耗費資源的排序(SORT)功能.
DISTINCT需要一次排序操作, 而其他的至少需要執行兩次排序. 通常, 帶有UNION, MINUS , INTERSECT
的SQL語句都可以用其他方式重寫. 如果你的數據庫的SORT_AREA_SIZE調配得好, 使用UNION , MINUS,
INTERSECT也是可以考慮的, 畢竟它們的可讀性很強
13、通常來說,如果語句能夠避免子查詢的 使用,就盡量不用子查詢。因為子查詢的開銷是相當昂貴的
14、用EXISTS替代IN
在許多基於基礎表的查詢中,為了滿足一個條件 ,往往需要對另一個表進行聯接。在這種情況下,使用EXISTS(或NOT EXISTS)通常將提高查詢的效率。
低效:
SELECT * FROM EMP (基礎表)
WHERE EMPNO > 0
AND DEPTNO IN (SELECT DEPTNO
FROM DEPT
WHERE LOC = ‘MELB’)
高效:
SELECT * FROM EMP (基礎表)
WHERE EMPNO > 0
AND EXISTS (SELECT ‘X’
FROM DEPT
WHERE DEPT.DEPTNO = EMP.DEPTNO
AND LOC = ‘MELB’)
15.用NOT EXISTS替代NOT IN
在子查詢中,NOT IN子句將執行一個內部的排序和合並,對子查詢中的表執行一個全表遍歷,因此是非常低效的。
為了避免使用NOT IN,可以把它改寫成外連接(Outer Joins)或者NOT EXISTS。
低效:
SELECT …
FROM EMP
WHERE DEPT_NO NOT IN (SELECT DEPT_NO
FROM DEPT
WHERE DEPT_CAT=’A’)
高效:
SELECT ….
FROM EMP E
WHERE NOT EXISTS (SELECT ‘X’
FROM DEPT D
WHERE D.DEPT_NO = E.DEPT_NO
AND DEPT_CAT = ‘A’)
16. 用表連接替換EXISTS
通常來說 ,采用表連接的方式比EXISTS更有效率 。
低效:
SELECT ENAME
FROM EMP E
WHERE EXISTS (SELECT ‘X’
FROM DEPT
WHERE DEPT_NO = E.DEPT_NO
AND DEPT_CAT = ‘A’)
高效:
SELECT ENAME
FROM DEPT D,EMP E
WHERE E.DEPT_NO = D.DEPT_NO
AND DEPT_CAT = ‘A’
17.用EXISTS替換DISTINCT
當提交一個包含對多表信息(比如部門表和雇員表)的查詢時,避免在SELECT子句中使用DISTINCT。 一般可以考慮用EXIST替換。
EXISTS 使查詢更為迅速,因為RDBMS核心模塊將在子查詢的條件一旦滿足后,立刻返回結果。
低效:
SELECT DISTINCT DEPT_NO,DEPT_NAME
FROM DEPT D,EMP E
WHERE D.DEPT_NO = E.DEPT_NO
高效:
SELECT DEPT_NO,DEPT_NAME
FROM DEPT D
WHERE EXISTS (SELECT ‘X’
FROM EMP E
WHERE E.DEPT_NO = D.DEPT_NO;
18.用索引提高效率:
(1)特點
優點: 提高效率 主鍵的唯一性驗證
代價: 需要空間存儲 定期維護
重構索引:
ALTER INDEX <INDEXNAME> REBUILD <TABLESPACENAME>;
(2)Oracle對索引有兩種訪問模式
索引唯一掃描 (Index Unique Scan)
索引范圍掃描 (index range scan)
(3)基礎表的選擇
基礎表(Driving Table)是指被最先訪問的表(通常以全表掃描的方式被訪問)。 根據優化器的不同,SQL語句中基礎表的選擇是不一樣的。
如果你使用的是CBO (COST BASED OPTIMIZER),優化器會檢查SQL語句中的每個表的物理大小,索引的狀態,然后選用花費最低的執行路徑。
(oracle 10g 及以后)
如果你用RBO (RULE BASED OPTIMIZER), 並且所有的連接條件都有索引對應,在這種情況下,基礎表就是FROM 子句中列在最后的那個表。
(oracle 10g以前)
(4)多個平等的索引
當SQL語句的執行路徑可以使用分布在多個表上的多個索引時,ORACLE會同時使用多個索引並在運行時對它們的記錄進行合並,檢索出僅對全部索引有效的記錄。
在ORACLE選擇執行路徑時,唯一性索引的等級高於非唯一性索引。然而這個規則只有當WHERE子句中索引列和常量比較才有效。如果索引列和其他表的索引類相比較。這種子句在優化器中的等級是非常低的。
如果不同表中兩個相同等級的索引將被引用,FROM子句中表的順序將決定哪個會被率先使用。 FROM子句中最后的表的索引將有最高的優先級。
如果相同表中兩個相同等級的索引將被引用,WHERE子句中最先被引用的索引將有最高的優先級。
優先級要看CBO的要結婚表的數據來看。
(5)等式比較優先於范圍比較
DEPTNO上有一個非唯一性索引,EMP_CAT也有一個非唯一性索引。
SELECT ENAME
FROM EMP
WHERE DEPTNO > 20
AND EMP_CAT = ‘A’;
這里只有EMP_CAT索引被用到,然后所有的記錄將逐條與DEPTNO條件進行比較. 執行路徑如下:
TABLE ACCESS BY ROWID ON EMP
INDEX RANGE SCAN ON CAT_IDX
即使是唯一性索引,如果做范圍比較,其優先級也低於非唯一性索引的等式比較。
(6)相同的索引列不能互相比較,這將會啟用全表掃描。
不使用索引:
SELECT ACCOUNT_NAME, AMOUNT
FROM TRANSACTION
WHERE ACCOUNT_NAME = NVL(:ACC_NAME, ACCOUNT_NAME)
使用索引:
SELECT ACCOUNT_NAME,AMOUNT
from transaction
WHERE ACCOUNT_NAME LIKE NVL(:ACC_NAME, ’%’)
19.在java代碼中盡量少用連接符“+”連接字符串!
20.避免在索引列上使用NOT、<>、!= 通常,
我們要避免在索引列上使用NOT, NOT會產生在和在索引列上使用函數相同的影響. 當ORACLE”遇到”NOT,他就會停止使用索引轉而執行全表掃描.
對索引列的使用最好就是 where 索引列 = 條件
!=將不使用索引,記住, 索引只能告訴你什么存在於表中, 而不能告訴你什么不存在於表中.。
21。避免在索引列上使用計算.
WHERE子句中,如果索引列是函數的一部分.優化器將不使用索引而使用全表掃描.
舉例:
低效:
SELECT … FROM DEPT WHERE SAL * 12 > 25000;
高效:
SELECT … FROM DEPT WHERE SAL > 25000/12;
22. 用>=替代>
高效:
SELECT * FROM EMP WHERE DEPTNO >=4
低效:
SELECT * FROM EMP WHERE DEPTNO >3
兩者的區別在於, 前者DBMS將直接跳到第一個DEPT等於4的記錄而后者將首先定位到DEPTNO=3的記錄並且向前掃描到第一個DEPT大於3的記錄.
23識別'低效執行'的SQL語句:
雖然目前各種關於SQL優化的圖形化工具層出不窮,但是寫出自己的SQL工具來解決問題始終是一個最好的方法:
SELECT EXECUTIONS , DISK_READS, BUFFER_GETS,
ROUND((BUFFER_GETS-DISK_READS)/BUFFER_GETS,2) Hit_radio,
ROUND(DISK_READS/EXECUTIONS,2) Reads_per_run,
SQL_TEXT
FROM V$SQLAREA
WHERE EXECUTIONS>0
AND BUFFER_GETS > 0
AND (BUFFER_GETS-DISK_READS)/BUFFER_GETS < 0.8
--and PARSING_SCHEMA_NAME = 'YYII_S6MISM'
ORDER BY 4 DESC;
24.避免在索引列上使用IS NULL和IS NOT NULL
避免在索引中使用任何可以為空的列,ORACLE將無法使用該索引.對於單列索引,如果列包含空值,索引中將不存在此記錄. 對於復合索引,如果每個列都為空,索引中同樣不存在此記錄. 如果至少有一個列不為空,則記錄存在於索引中.舉例: 如果唯一性索引建立在表的A列和B列上, 並且表中存在一條記錄的A,B值為(123,null) , ORACLE將不接受下一條具有相同A,B值(123,null)的記錄(插入). 然而如果所有的索引列都為空,ORACLE將認為整個鍵值為空而空不等於空. 因此你可以插入1000 條具有相同鍵值的記錄,當然它們都是空! 因為空值不存在於索引列中,所以WHERE子句中對索引列進行空值比較將使ORACLE停用該索引.
低效: (索引失效)
SELECT * FROM DEPARTMENT WHERE DEPT_CODE IS NOT NULL;
高效: (索引有效)
SELECT * FROM DEPARTMENT WHERE DEPT_CODE >=0;
25.避免改變索引列的類型.:
當比較不同數據類型的數據時, ORACLE自動對列進行簡單的類型轉換.
假設 EMPNO是一個數值類型的索引列.
SELECT … FROM EMP WHERE EMPNO = ‘123'
實際上,經過ORACLE類型轉換, 語句轉化為:
SELECT … FROM EMP WHERE EMPNO = TO_NUMBER(‘123')
幸運的是,類型轉換沒有發生在索引列上,索引的用途沒有被改變.
現在,假設EMP_TYPE是一個字符類型的索引列.
SELECT … FROM EMP WHERE EMP_TYPE = 123
這個語句被ORACLE轉換為:
select … from EMP WHERETO_NUMBER(EMP_TYPE)=123
因為內部發生的類型轉換, 這個索引將不會被用到! 為了避免ORACLE對你的SQL進行隱式的類型轉換, 最好把類型轉換用顯式表現出來. 注意當字符和數值比較時, ORACLE會優先轉換數值類型到字符類型
26.如果檢索數據量超過30%的表中記錄數.使用索引將沒有顯著的效率提高.
b. 在特定情況下, 使用索引也許會比全表掃描慢, 但這是同一個數量級上的區別. 而通常情況下,使用索引比全表掃描要塊幾倍乃至幾千倍!
27.用Explain Plan分析SQL語句
EXPLAIN PLAN 是一個很好的分析SQL語句的工具, 它甚至可以在不執行SQL的情況下分析語句. 通過分析, 我們就可以知道ORACLE是怎么樣連接表, 使用什么方式掃描表(索引掃描或全表掃描)以及使用到的索引名稱。
28.對UNION的優化
由於UNION會對查詢結果進行排序,而且過濾重復記錄,因此其執行效率沒有UNION ALL高。 UNION操作會使用到SORT_AREA_SIZE內存塊,因此對這塊內存的優化也非常重要。
可以使用下面的SQL來查詢排序的消耗量 :
select *
from V$SYSSTAT
where name like 'sort%'
29.連接多個掃描
如果對一個列和一組有限的值進行比較,優化器可能執行多次掃描並對結果進行合並連接。
舉例:
SELECT *
FROM LODGING
WHERE MANAGER IN (‘BILL GATES’, ’KEN MULLER’)
優化器可能將它轉換成以下形式:
SELECT *
FROM LODGING
WHERE MANAGER = ‘BILL GATES’
OR MANAGER = ’KEN MULLER’
30.使用日期
當使用日期時,需要注意如果有超過5位小數加到日期上,這個日期會進到下一天!
select TO_DATE('20010101','yyyymmdd')+0.99999
from DUAL;
Returns:
02-1月 -01
select TO_DATE('20010101','yyyymmdd')+0.999995
from DUAL;
RETURNS:
02-1月 -01
31.使用顯示游標(CURSORS)
使用隱式的游標,將會執行兩次操作。第一次檢索記錄,第二次檢查TOO MANY ROWS 這個exception。而顯式游標不執行第二次操作。
32.優化EXPORT和IMPORT
使用較大的BUFFER(比如10MB , 10,240,000)可以提高EXPORT和IMPORT的速度.
ORACLE將盡可能地獲取你所指定的內存大小,即使在內存不滿足,也不會報錯.這個值至少要和表中最大的列相當,否則列值會被截斷.
譯者按:
可以肯定的是, 增加BUFFER會大大提高EXPORT , IMPORT的效率. (曾經碰到過一個CASE, 增加BUFFER后,IMPORT/EXPORT快了10倍!)
作者可能犯了一個錯誤: “這個值至少要和表中最大的列相當,否則列值會被截斷. “
其中最大的列也許是指最大的記錄大小.
33.分離表和索引
總是將你的表和索引建立在不同的表空間內(TABLESPACES)。
決不要將不屬於ORACLE內部系統的對象存放到SYSTEM表空間里。
確保數據表空間和索引表空間置於不同的硬盤上。
