定義:
在數據庫中,對無索引的表進行查詢一般稱為全表掃描。全表掃描是
數據庫服務器用來搜尋表的每一條記錄的過程,直到所有符合給定條件的記錄返回為止。
索引是對
數據庫表中一列或多列的值進行排序的一種結構,使用索引可快速訪問數據庫表中的特定信息。如果想按特定職員的姓來查找他或她,則與在表中搜索所有的行相比,索引有助於更快地獲取信息。索引的一個主要目的就是加快檢索表中數據的方法,亦即能協助信息搜索者盡快的找到符合限制條件的記錄ID的輔助數據結構。
基本上。要得到的數據占整個表的大部分,則全表掃描更合適,然只是整個表的很小一部分,則索引掃描通常更好。
建索引的依據是平時條件字段被查詢的次數,選擇被查詢次數最多的字段建立索引。
列舉幾種會引起全表掃描的SQL,平時工作中努力避免
1、模糊查詢效率很低:
原因:like本身效率就比較低,應該盡量避免查詢條件使用like;對於like ‘%...%’(全模糊)這樣的條件,是無法使用索引的,全表掃描自然效率很低;另外,由於匹配算法的關系,模糊查詢的字段長度越大,模糊查詢效率越低。
解決辦法:首先盡量避免模糊查詢,如果因為業務需要一定要使用模糊查詢,則至少保證不要使用全模糊查詢,對於右模糊查詢,即like ‘…%’,是會使用索引的;左模糊like
‘%...’無法直接使用索引,但可以利用reverse + function index 的形式,變化成 like ‘…%’;全模糊是無法優化的,一定要的話考慮用搜索引擎。出於降低
數據庫服務器的負載考慮,盡可能地減少數據庫模糊查詢。
2、查詢條件中含有is null的select語句執行慢
原因:
Oracle 9i中,查詢字段is null時單索引失效,引起全表掃描。
解決方法:
SQL語法中使用NULL會有很多麻煩,最好索引列都是NOT NULL的;對於is null,可以建立組合索引,nvl(字段,0),對表和索引analyse后,is null查詢時可以重新啟用索引查找,但是效率還不是值得肯定;is not null 時永遠不會使用索引。一般數據量大的表不要用is null查詢。
3、查詢條件中使用了不等於操作符(<>、!=)的select語句執行慢
原因:SQL中,不等於操作符會限制索引,引起全表掃描,即使比較的字段上有索引
解決方法:通過把不等於操作符改成or,可以使用索引,避免全表掃描。例如,把column<>’aaa’,改成column<’aaa’ or column>’aaa’,就可以使用索引了。
4、使用組合索引,如果查詢條件中沒有前導列,那么索引不起作用,會引起全表掃描;但是從Oracle9i開始,引入了索引跳躍式掃描的特性,可以允許優化器使用組合索引,即便索引的前導列沒有出現在WHERE子句中。例如:create index skip1 on emp5(job,empno); 全索引掃描 select count(*) from emp5 where empno=7900; 索引跳躍式掃描 select /*+ index(emp5 skip1)*/ count(*) from emp5 where empno=7900; 前一種是全表掃描,后一種則會使用組合索引。
5、or語句使用不當會引起全表掃描
原因:where子句中比較的兩個條件,一個有索引,一個沒索引,使用or則會引起全表掃描。例如:where A=:1 or B=:2,A上有索引,B上沒索引,則比較B=:2時會重新開始全表掃描。
6、組合索引,排序時應按照組合索引中各列的順序進行排序,即使索引中只有一個列是要排序的,否則排序性能會比較差。例如:create index skip1 on emp5(job,empno,date); select job,empno from emp5 where job=’manager’and empno=’10’ order by job,empno,date desc; 實際上只是查詢出符合job=’manager’and empno=’10’條件的記錄並按date降序排列,但是寫成order by date desc性能較差。
7、Update 語句,如果只更改1、2個字段,不要Update全部字段,否則頻繁調用會引起明顯的性能消耗,同時帶來大量日志。
8、對於多張大數據量(這里幾百條就算大了)的表JOIN,要先分頁再JOIN,否則邏輯讀會很高,性能很差。
9、select count(*) from table;這樣不帶任何條件的count會引起全表掃描,並且沒有任何業務意義,是一定要杜絕的。
10、sql的where條件要綁定變量,比如where column=:1,不要寫成where column=‘aaa’,這樣會導致每次執行時都會重新分析,浪費CPU和內存資源。