溫馨提醒:
TMP_007數據量為:409373
1.去除在謂詞列上編寫的任何標量函數
優化前:(耗時3.1s)
優化后:(耗時0.922s)
總結:
DB2可以選擇使用START_DATE上的列索引,但是在列上使用了函數后,DB2就無法使用列索引了,從而導致查詢效率變低。
2.去除在謂詞列上編寫的任何數學運算
優化前:(耗時10.265)
優化后:(耗時3.39s)
總結:
DB2查詢時候,會優先選擇列CONTRACT_AMT上的索引,如果直接對列CONTRACT_AMT應用數學運算,DB2就無法使用索引了。一定要做到:列本身(不加數學運算)放在操作符的一邊,而所有的計算都放在另外一邊。
3.SQL語句中指定查詢列
優化前:(耗時13.15s)
優化后:(耗時2.922s)
總結:
如果Select包含不需要的列,優化工具會選擇Indexonly=’N’,這會強制DB2必須進入數據頁來得到所請求的特定列,這就要求更多的I/O操作,梁歪,這些多余的列可能是某些排序的部分,這樣一來就需要和傳遞一個更大的排序文件,相應的會使排序成本更高。
4.盡可能不使用distinct
優化前:(耗時0.687s)
優化后:(耗時0.437s)
總結:
在測試distinct與group by性能的過程中,在列CST_ID上添加索引后,發現group by 確實比distinct快一些,但是在數據分布比較離散的情況下使用group by ,比較集中的情況下使用distinct.表數據量較少的情況隨便使用哪個都一樣,不管選擇誰,都要建立索引
5.Exists、in、not in 、not exists的使用場景選擇
5.1 in跟exists的區別:
例如:表A(小表),表B(大表)
優化前:(耗時1.93s)
優化后:(耗時1.125s)
相反的,
優化前:(耗時1.9s)
優化后:(耗時1.0s)
總結:
in是把外表和內表作hash連接,而exists是對外表作loop循環,每次loop循環再對內表進行查詢,一直以來認為exists比in效率高的說法是不准確的。如果查詢的兩個表大小相當,那么用in和exists差別不大;如果兩個表中一個較小一個較大,則子查詢表大的用exists,子查詢表小的用in;
簡稱:子大Exists,子小in
5.2 not in 與 not exists區別:
如果查詢語句使用了not in,那么對內外表都進行全表掃描,沒有用到索引;而not exists的子查詢依然能用到表上的索引。所以無論哪個表大,用not exists都比not in 要快。
優化前:(耗時15.344s)
優化后:(耗時2.719s)
總結:
在union中,DB2最后會自動執行一個排序來消除重復值,這樣是很耗費資源的,所以在不需要去重復的情況下,盡可能使用UNION ALL 代替union
N.模板
優化前:(耗時3.1s)
優化后:(耗時0.922s)
總結: