1. 首先我們看一段代碼:
for(int i=0;i<1000;i++){ for(int j=0;j<100;j++){ for(int k=0;k<10;k++){ testFunction (i,j,k); } } }
從給出的代碼可知,不論如何優化,testFunction執行的次數都是相同的,該部分不存在優化的可能。那么,代碼的優化只能從循環變量i、j、k的實例化、初始化、比較、自增等方面的耗時上進行分析。
首先,我們先分析原題代碼循環變量在實例化、初始化、比較、自增等方面的耗時情況:
(注:由於單次耗時視不同機器配置而不同,上表相關耗時采用處理的次數進行說明)
該代碼的性能優化就是盡可能減少循環變量i、j、k的實例化、初始化、比較、自增的次數,同時,不能引進其它可能的運算耗時。
2. 解決過程
(1)優化方案一
for (int i = 0; i < 10; i++) for (int j = 0; j < 100; j++) for (int k = 0; k < 1000; k++) testFunction (k, j, i);
該方案主要是將循環次數最少的放到外面,循環次數最多的放里面,這樣可以最大程度的(注:3個不同次數的循環變量共有6種排列組合情況,此種組合為最優)減少相關循環變量的實例化次數、初始化次數、比較次數、自增次數,方案耗時情況如下:
原來代碼中:i需要比較1000次,j需要比較1000*100次,k需要比較1000*100*10次。
總的比較次數是1000+1000*100+10*100*1000次
現在優化方案一:但是k需要比較10次,j需要比較10*100次,i需要比較10*100*1000次。
總的比較次數是10+10*100+10*100*1000次
所以后面的代碼比前面的代碼少比較1000+1000*100-(10+10*100)次!
(2)優化方案二
int i, j, k; for (i = 0; i < 10; i++) for (j = 0; j < 100; j++) for (k = 0; k < 1000; k++) testFunction (k, j, i);
該方案在方案一的基礎上,將循環變量的實例化放到循環外,這樣可以進一步減少相關循環變量的實例化次數,方案耗時情況如下:
變量 | 實例化(次數) | 初始化(次數) | 比較(次數) | 自增(次數) |
i | 1 | 1 | 10 | 10 |
j | 1 | 10 | 10 * 100 | 10 * 100 |
k | 1 | 10 * 100 | 10 * 100 * 1000 | 10 * 100 * 1000 |
3. 總結
從案例分析和解決過程中的三個表的分析可知,優化方案一和優化方案二的性能都比原代碼的性能好,其中優化方案二的性能是最好的。在嵌套For循環中,將循環次數多的循環放在內側,循環次數少的循環放在外側,其性能會提高;減少循環變量的實例化,其性能也會提高。從測試數據可知,對於兩種優化方案,如果在循環次數較少的情況下,其運行效果區別不大;但在循環次數較多的情況下,其效果就比較明顯了。