前言
雖說在學OI的時候學到了非常多的有遞歸結構的算法或方法,也很清楚他們的復雜度,但更多時候只是能夠大概腦補這些方法為什么是這個復雜度,而從未從定理的角度去嚴格證明他們。因此借着這個機會把主定理整個梳理一遍。
介紹
主定理(Master Theorem)提供了用於分析一類有遞歸結構算法時間復雜度的方法。這種遞歸算法通常有這樣的結構:
def solve(problem):
solve_without_recursion()
for subProblem in problem:
solve(subProblem)
我們可以用一種表示方式來概括這些結構的算法:對於一個規模為\(n\)的問題,我們把它分為\(a\)個子問題,每個子問題規模為\(\frac nb\)。那么這種方法的復雜度\(T(n)\)可以表示為:
其中\(a\ge 1,b>1\)為常數,\(\frac{n}{b}\)指\(\lfloor \frac{n}{b}\rfloor\)或\(\lceil \frac{n}{b}\rceil\),\(f(n)\)為創造這些遞歸或者將這些子問題結果整合的函數。對這個方法我們可以建一個遞歸樹:
其中樹高為\(\log_bn\),樹的第\(i\)層有\(a^i\)個節點,每個節點的問題規模為\(\frac{n}{b^i}\)。則這棵樹有\(a^{\log_bn}=n^{\log_ba}\)個葉子節點。因此這種方法的復雜度也可以表示為:
從中我們可以看出,整個方法的復雜度取決於\(f(n)\)的復雜度。主定理對\(f(n)\)分了三種情況:
- \(\exist \varepsilon>0\ s.t.\ f(n)=O(n^{\log_ba-\varepsilon})\)。此時\(T(n)=\Theta(n^{\log_ba})\)。
- \(f(n)=\Theta(n^{\log_ba})\)。此時\(T(n)=\Theta(n^{\log_ba}\lg n)\)。
- \(\exist \varepsilon>0\ s.t.\ f(n)=\Omega(n^{\log_ba+\varepsilon})\),且\(\exist c<1\),當\(n\)足夠大時,有\(a\, f(\frac{n}{b})\le c\, f(n)\)。此時\(T(n)=\Theta(f(n))\)。
\(f(n)\)含\(\log\)的情況類似,待補充。
證明
Case 1
令\(g(n)=\sum_{i=0}^{\log_bn-1}a^if(\frac{n}{b^i})\),由\(f(n)=O(n^{\log_ba-\varepsilon})\),得:
之后就是對后面式子的化簡:
因此\(g(n)=O(\sum_{i=0}^{\log_bn-1}a^i(\frac{n}{b^i})^{\log_ba-\varepsilon})=O(n^{\log_ba})\)。所以有:
Case 2
同Case 1。令\(g(n)=\sum_{i=0}^{\log_bn-1}a^if(\frac{n}{b^i})\)得:
繼續化簡:
因此可得\(g(n)=n^{\log_ba}\log_bn=n^{\log_ba}\lg n\)。所以有:
Case 3
還是令\(g(n)=\sum_{i=0}^{\log_bn-1}a^if(\frac{n}{b^i})\)。但Case 3這里有一個條件:\(a\, f(\frac{n}{b})\le c\, f(n)\)。我們對這個條件做一下處理:
由此我們可以很輕易的向下化簡:
得\(g(n)=O(f(n))\)。又因為\(g(n)=\sum_{i=0}^{\log_bn-1}a^if(\frac{n}{b^i})\ge f(n)\),得\(g(n)=\Omega(f(n))\)。因此\(g(n)=\Theta(f(n))\)。
所以有:
證畢。
應用
二叉樹建樹
此時\(\log_ba<1\),滿足Case 1。
BFPRT(Median of Medians)
此時\(\log_ba>1\),即划分之后總規模減小(\(1/5+7/10<1\)),滿足Case 2。
歸並排序
此時\(\log_ba=1\),滿足Case 3。