出處:
查詢語句的時候盡量避免全表掃描,使用全掃描,索引掃描!會引起全表掃描的幾種SQL如下
1、模糊查詢效率很低:
原因:like本身效率就比較低,應該盡量避免查詢條件使用like;對於like ‘%...%’(全模糊)這樣的條件,是無法使用索引的,全表掃描自然效率很低;另外,由於匹配算法的關系,模糊查詢的字段長度越大,模糊查詢效率越低。
解決辦法:首先盡量避免模糊查詢,如果因為業務需要一定要使用模糊查詢,則至少保證不要使用全模糊查詢,對於右模糊查詢,即like ‘…%’,是會使用索引的;左模糊like
‘%...’無法直接使用索引,但可以利用reverse + function index 的形式,變化成 like ‘…%’;全模糊是無法優化的,一定要的話考慮用搜索引擎。出於降低數據庫服務器的負載考慮,盡可能地減少數據庫模糊查詢。
2、查詢條件中含有is null的select語句執行慢
原因:Oracle 9i中,查詢字段is null時單索引失效,引起全表掃描。
解決方法:SQL語法中使用NULL會有很多麻煩,最好索引列都是NOT NULL的;對於is null,可以建立組合索引,nvl(字段,0),對表和索引analyse后,is null查詢時可以重新啟用索引查找,但是效率還不是值得肯定;is not null 時永遠不會使用索引。一般數據量大的表不要用is null查詢。
3、查詢條件中使用了不等於操作符(<>、!=)的select語句執行慢
原因:SQL中,不等於操作符會限制索引,引起全表掃描,即使比較的字段上有索引
解決方法:通過把不等於操作符改成or,可以使用索引,避免全表掃描。
column<>’aaa’ //全表掃描 column<’aaa’ OR column>’aaa’ //使用索引
4、組合索引使用不當
查詢條件中沒有前導列,導致索引不起作用;
create index skip1 on emp5(job,empno); select count(*) from emp5 where empno=7900; //全表掃描 select /*+ index(emp5 skip1)*/ count(*) from emp5 where empno=7900; //使用組合索引
使用組合索引時,在排序時應按照組合索引中各列順序進行排序(即使只有一個列需要排序),否則性能較差。
create index skip1 on emp5(job,empno,date); select job,empno from emp5 where job=’manager’and empno=’10’ ORDER BY date desc; //性能較差 select job,empno from emp5 where job=’manager’and empno=’10’ ORDER BY job,empno,date desc; //使用組合索引
5、OR
語句使用不當
OR
語句連接的條件中包含的列沒有全部建立索引。
例如:where子句中比較的兩個條件,一個有索引,一個沒索引,使用or則會引起全表掃描。例如:where A=:1 or B=:2,A上有索引,B上沒索引,則比較B=:2時會重新開始全表掃描。
6、UPDATA
語句updata了全部字段
如果只更改1、2個字段,不要Update全部字段,否則頻繁調用會引起明顯的性能消耗,同時帶來大量日志。
7、對於多張大數據量的表JOIN
原因:沒有先分頁,導致邏輯讀很高;
解決方法:先分頁再JOIN
。
8、select count(*) from table;
這樣不帶任何條件的count會引起全表掃描,並且沒有任何業務意義,是一定要杜絕的。
9、對於反復執行的查詢,WHERE
子句中使用變量綁定可以降低解析時間,提高性能
10、應盡量避免在where 子句中對字段進行null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,
如:
select id from t where num is null
NULL對於大多數數據庫都需要特殊處理,MySQL也不例外,它需要更多的代碼,更多的檢查和特殊的索引邏輯,有些開發人員完全沒有意識到,創建表時NULL是默認值,但大多數時候應該使用NOT NULL,或者使用一個特殊的值,如0,-1作為默 認值。
不能用null作索引,任何包含null值的列都將不會被包含在索引中。即使索引有多列這樣的情況下,只要這些列中有一列含有null,該列 就會從索引中排除。也就是說如果某列存在空值,即使對該列建索引也不會提高性能。 任何在where子句中使用is null或is not null的語句優化器是不允許使用索引的。
此例可以在num上設置默認值0,確保表中num列沒有null值,然后這樣查詢:
select id from t where num=0;
11、應盡量避免在where 子句中使用or 來連接條件,否則將導致引擎放棄使用索引而進行全表掃描
如:
select id from t where num=10 or num=20;
可以這樣查詢:
select id from t where num=10 union all select id from t where num=20;
12、in 和not in 也要慎用,否則會導致全表掃描
如:
select id from t where num in(1,2,3);
對於連續的數值,能用between 就不要用in 了:
select id from t where num between 1 and 3;
13、應盡量避免在where 子句中對字段進行表達式操作,這將導致引擎放棄使用索引而進行全表掃描。
如:
select id from t where num/2=100;
應改為:
select id from t where num=100*2
14、應盡量避免在where子句中對字段進行函數操作,這將導致引擎放棄使用索引而進行全表掃描。
如:
select id from t where substring(name,1,3)='abc'; --name select id from t where datediff(day,createdate,'2005-11-30')=0; --‘2005-11-30’
應改為:
select id from t where name like 'abc%' select id from t where createdate>='2005-11-30' and createdate<'2005-12-1'
15、盡量使用數字型字段,若只含數值信息的字段盡量不要設計為字符型,這會降低查詢和連接的性能,並會增加存儲開銷。這是因為引擎在處理查詢和連接時會逐個比較字符串中每一個字符,而對於數字型而言只需要比較一次就夠了。
16、盡可能的使用varchar/nvarchar 代替char/nchar ,因為首先變長字段存儲空間小,可以節省存儲空間,其次對於查詢來說,在一個相對較小的字段內搜索效率顯然要高些。
17、盡量避免大事務操作,提高系統並發能力。
18、盡量避免向客戶端返回大數據量,若數據量過大,應該考慮相應需求是否合理。
19、索引並不是越多越好,索引固然可以提高相應的select 的效率,但同時也降低了insert 及update 的效率,因為insert 或update 時有可能會重建索引,所以怎樣建索引需要慎重考慮,視具體情況而定。一個表的索引數最好不要超過6個,若太多則應考慮一些不常使用到的列上建的索引是否有必要。
20、並不是所有索引對查詢都有效,SQL是根據表中數據來進行查詢優化的,當索引列有大量數據重復時,SQL查詢可能不會去利用索引,如一表中有字段sex,male、female幾乎各一半,那么即使在sex上建了索引也對查詢效率起不了作用。