跟着編程之美學算法——最長遞增子序列


之前學習了動態規划中最基本的問題,最長公共子序列,具體解法,見前前一篇博客:

http://www.cnblogs.com/liyukuneed/archive/2013/05/22/3090597.html

本篇博客要繼續解決一個升級的問題——最長遞增子序列

問題定義:

給定一個長度為N的數組,找出一個最長的單調自增子序列(不一定連續,但是順序不能亂)。例如:給定一個長度為6的數組A{5, 6, 7, 1, 2, 8},則其最長的單調遞增子序列為{5,6,7,8},長度為4.

解法一:最長公共子序列法:

仔細思考上面的問題,其實可以把上面的問題轉化為求最長公共子序列的問題。原數組為A{5, 6, 7, 1, 2, 8},下一步,我們對這個數組進行排序,排序后的數組為A‘{1, 2, 5, 6, 7, 8}。我們有了這樣的兩個數組后,如果想求數組A的最長遞增子序列,其實就是求數組A與它的排序數組A‘的最長公共子序列。我來思考下原問題的幾個要素:最長、遞增、子序列(即順序不變)。

遞增:A‘數組為排序數組,本身就是遞增的,保證了兩序列的最長公共子序列的遞增特性。

子序列:由於A數組就是原數組,其任意的子序列都是順序不變的,這樣就保證了兩序列的最長公共子序列的順序不變。

最長:顯而易見。

具體的解法請參見上一篇博客:

http://www.cnblogs.com/liyukuneed/archive/2013/05/22/3090597.html

 

解法二:動態規划法(O(N^2))

既然是動態規划法,那么最重要的自然就是尋找子問題,對於這個問題,我們找到他的子問題:

對於長度為N的數組A[N] = {a0, a1, a2, ..., an-1},假設假設我們想求以aj結尾的最大遞增子序列長度,設為L[j],那么L[j] = max(L[i]) + 1, where i < j && a[i] < a[j], 也就是i的范圍是0到j - 1。這樣,想求aj結尾的最大遞增子序列的長度,我們就需要遍歷j之前的所有位置i(0到j-1),找出a[i] < a[j],計算這些i中,能產生最大L[i]的i,之后就可以求出L[j]。之后我對每一個A[N]中的元素都計算以他們各自結尾的最大遞增子序列的長度,這些長度的最大值,就是我們要求的問題——數組A的最大遞增子序列。

時間復雜度:由於每一次都要與之前的所有i做比較,這樣時間復雜度為O(N^2)。

 

解法三:動態規划法(O(NlogN))

上面的解法時間復雜度仍然為O(N^2),與解法一沒有明顯的差別。仔細分析一下原因,之所以慢,是因為對於每一個新的位置j都需要遍歷j之前的所以位置,找出之前位置最長遞增子序列長度。那么我們是不是可以有一中方法能不用遍歷之前所有的位置,而可以更快的確定i的位置呢?

這就需要申請一個長度為N的空間,B[N],用變量len記錄現在的最長遞增子序列的長度。

B數組內任意元素B[i],記錄的是最長遞增子序列長度為i的序列的末尾元素的值,也就是這個最長遞增子序列的最大元素的大小值。

首先,把d[1]有序地放到B里,令B[1] = 2,就是說當只有1一個數字2的時候,長度為1的LIS的最小末尾是2。這時Len=1

然后,把d[2]有序地放到B里,令B[1] = 1,就是說長度為1的LIS的最小末尾是1,d[1]=2已經沒用了,很容易理解吧。這時Len=1

接着,d[3] = 5,d[3]>B[1],所以令B[1+1]=B[2]=d[3]=5,就是說長度為2的LIS的最小末尾是5,很容易理解吧。這時候B[1..2] = 1, 5,Len=2

再來,d[4] = 3,它正好加在1,5之間,放在1的位置顯然不合適,因為1小於3,長度為1的LIS最小末尾應該是1,這樣很容易推知,長度為2的LIS最小末尾是3,於是可以把5淘汰掉,這時候B[1..2] = 1, 3,Len = 2

繼續,d[5] = 6,它在3后面,因為B[2] = 3, 而6在3后面,於是很容易可以推知B[3] = 6, 這時B[1..3] = 1, 3, 6,還是很容易理解吧? Len = 3 了噢。

第6個, d[6] = 4,你看它在3和6之間,於是我們就可以把6替換掉,得到B[3] = 4。B[1..3] = 1, 3, 4, Len繼續等於3

第7個, d[7] = 8,它很大,比4大,嗯。於是B[4] = 8。Len變成4了

第8個, d[8] = 9,得到B[5] = 9,嗯。Len繼續增大,到5了。

最后一個, d[9] = 7,它在B[3] = 4和B[4] = 8之間,所以我們知道,最新的B[4] =7,B[1..5] = 1, 3, 4, 7, 9,Len = 5。

於是我們知道了LIS的長度為5。

注意,這個1,3,4,7,9不是LIS,它只是存儲的對應長度LIS的最小末尾。有了這個末尾,我們就可以一個一個地插入數據。雖然最后一個d[9] = 7更新進去對於這組數據沒有什么意義,但是如果后面再出現兩個數字 8 和 9,那么就可以把8更新到d[5], 9更新到d[6],得出LIS的長度為6。

然后應該發現一件事情了:在B中插入數據是有序的,而且是進行替換而不需要挪動——也就是說,我們可以使用二分查找,將每一個數字的插入時間優化到O(logN)~~~~~於是算法的時間復雜度就降低到了O(NlogN)~!

 

根據上面的分析,下面是后兩種方法的C++代碼實現:

 1 #include <iostream>
 2 
 3 using namespace std;
 4 
 5 // LIS[j] = max(LIS[i]) + 1
 6 int LIS_DP_N2(int *array, int nLength)
 7 {
 8     int LIS[nLength];
 9     for(int i = 0; i < nLength; i++)
10     {
11         LIS[i] = 1;
12     }
13     
14     for(int i = 1; i < nLength; i++)
15     {
16         int maxLen = 0;
17         for(int j = 0; j < i; j++)
18         {
19             if(array[i] > array[j])
20             {
21                 if(maxLen < LIS[j])
22                     maxLen = LIS[j];
23             }
24         }
25         LIS[i] = maxLen + 1;
26     }
27     int maxLIS = 0;
28     for(int i = 0; i < nLength; i++)
29     {
30         if(maxLIS < LIS[i])
31             maxLIS = LIS[i];
32     }
33     
34     return maxLIS;
35 }
36 
37 int BinarySearch(int *array, int value, int nLength)
38 {
39     int begin = 0;
40     int end = nLength - 1;
41     while(begin <= end)
42     {
43         int mid = begin + (end - begin) / 2;
44         if(array[mid] == value)
45             return mid;
46         else if(array[mid] > value)
47             end = mid - 1;
48         else
49             begin = mid + 1;
50     }
51     return begin;
52 }
53 
54 int LIS_DP_NlogN(int *array, int nLength)
55 {
56     int B[nLength];
57     int nLISLen = 1;
58     B[0] = array[0];
59 
60     for(int i = 1; i < nLength; i++)
61     {
62         if(array[i] > B[nLISLen - 1])
63         {
64             B[nLISLen] = array[i];
65             nLISLen++;
66         }
67         else
68         {
69             int pos = BinarySearch(B, array[i], nLISLen);
70             B[pos] = array[i];
71         }
72     }
73     return nLISLen;
74 }
75 
76 int main()
77 {
78     int data[6] = {5, 6, 7, 1, 2, 8};
79     cout<<LIS_DP_N2(data, 6)<<endl;
80     cout<<LIS_DP_NlogN(data, 6)<<endl;
81     return 0;
82 }
View Code

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM