復雜度分析(上)
@(數據結構與算法)
- 數據結構與算法本質上是解決程序運行速度快和存儲空間省的問題,所以需要通過一個指標,即時間、空間復雜度來衡量這個問題
- 為什么需要復雜度分析
- 程序測試運行結果會受到測試環境的硬件影響
- 測試結果受數據規模的影響很大
- 假設每行代碼的運行時間相同,則可得到所有代碼的執行時間 T(n) 與每行代碼的執行次數成正比。
- 代碼塊:
1 int cal(int n){
2 int sum = 0; //執行 1 次
3 int i = 1: //執行 1 次
4 int j = 1; //執行 1 次
5 for(;i <= n;++i){ //執行 n 次
6 j = 1; //執行 n 次
7 for(; j <= n; ++j){ //執行 n^2 次
8 sum = sum + i * j; //執行 n^2 次
9 }
10 }
11 }
故上述代碼執行時間為 $ T(n) = (2n^2+2n+3) * time $ 。
5. 大 $O$ 時間復雜度公式:
$$ T(n) = O(f(n)) $$
其中,$T(n)$ 代表代碼執行時間;$n$ 表示數據規模大小;$f(n)$ 表示每行代碼執行的次數總和,$O$ 表示代碼的執行時間 $T(n)$ 與 $f(n)$ 表達式成正比。
大 $O$ 時間復雜度實際上並不表示代碼真正的執行時間,而是表示代碼執行時間隨數據規模增長的變化趨勢,當 $n$ 很大時,公式中的低階、常量、系數三部分並不做魚增長趨勢,所以都可以忽略。只需要記錄一個最大量級就可以了。
所以上面的 $T(n)$ 的時間復雜度為 $O(n^2)$。
6. 分析代碼時間復雜度的方法:
- 只關注循環執行次數最多的一段代碼。
- 加法法則:總復雜度等於量級最大的那段代碼的復雜度
- 乘法法則:嵌套代碼的復雜度等於嵌套內外代碼復雜度的乘積
1 int cal(int n){
2 int ret = 0;
3 int i = 1;
4 for (; i<n; ++i){
5 ret = ret + f(i)
6 }
7 }
8
9 int f(int n){
10 int sum = 0;
11 int i = 1;
12 for(; i < n; ++i){
13 sum = sum + i;
14 }
15 return sum;
16 }
單獨看 cal()
函數,假設 f(n) 只是一個普通的操作,則其 $T1(n) = O(n)$ 。但 f(n) 是一個函數,其時間復雜度是 $T2(n) = O(n)$,所以整個 cal()
函數的時間復雜度就是 ,$T(n) = T1(n)T2(n) = O(nn) = O(n^2)$
7. 常見的時間復雜度量級:
可粗路分為兩類:多項式量級和非多項式量級,其中,非多項式量級只有兩個:$O(2^n)$ 和 $O(n!)$。其中時間復雜度為非多項式量級的算法問題稱作 NP(Non-Deterministic Ploynomial,非確定多項式)問題。
當數據規模 n 越來越大是,非多項式量級算法的執行時間會急劇增加,是非常低效的算法。
其他的量級還有 $O(m +n)$,$O(m*n)$
8. 空間復雜度:類比一下時間復雜度,表示的算法的空間與數據規模之間的增長關系。
1 void print(int n) {
2 int i = 0;
3 int[] a = new int[n];
4 for (i; i <n; ++i) {
5 a[i] = i * i;
6 }
7 for (i = n-1; i >= 0; --i) {
8 print out a[i]
9 }
10}
第 3 行申請了一個大小為 n 的 int 類型數組,剩下的代碼沒有占用更多的空間,所以整段代碼的空間復雜度就是 $O(n)$。
常用的空間復雜度就是 $O(1)$,$O(n)$,$O(n^2)$。
參考自:極客時間《數據結構與算法之美 》專欄