最長公共子序列


  

最長公共子序列

  這可是板子題;

  題目;

  

 

     我當初面對這題的時候滿臉的問號,不是最長,還是公共的么,怎么會是3,怎么該也是2啊,有和我一樣疑問的小伙伴在評論區扣2,

   既然我說了這是板子題,那么這最長公共子序列都是這樣的定義,

   首先;

       

    這個是一樣的吧,盤它,箭頭繼續指向下一個

        

    到這字母就不一樣, 繼續下一個,一直到

        

    就是這樣,繼續的尋找,注意我的繼續下一個可不一定是連續的,注意啊,注意,這個繼續可是有選和不選的意味呢,說到這里,有聰明的朋友又知道了,是不是。。。。

   沒錯,這里我們可以使用dp,什么是最長公共子序列呢,就是順序的公共字母,可以存在空格和間隙,但是一定要是有序的。(蒟蒻見解,若有出入,誠邀指正) 

   這里我用了一位大佬的文章,他寫的實在太好了,轉載於https://www.cnblogs.com/wkfvawl/p/9362287.html

 

 

  一,問題描述

      給定兩個字符串,求解這兩個字符串的最長公共子序列(Longest Common Sequence)。比如字符串1:BDCABA;字符串2:ABCBDAB

   則這兩個字符串的最長公共子序列長度為4,最長公共子序列是:BCBA

  二,算法求解

      這是一個動態規划的題目。對於可用動態規划求解的問題,一般有兩個特征:①最優子結構;②重疊子問題

  ①最優子結構

   設 X=(x1,x2,.....xn) 和 Y={y1,y2,.....ym} 是兩個序列,將 X 和 Y 的最長公共子序列記為LCS(X,Y)

   找出LCS(X,Y)就是一個最優化問題。因為,我們需要找到X 和 Y中最長的那個公共子序列。而要找X 和 Y的LCS,首先考慮X的最后一個元素和Y的最后一個元素。

      1)如果 xn=ym,即X的最后一個元素與Y的最后一個元素相同,這說明該元素一定位於公共子序列中。因此,現在只需要找:LCS(Xn-1,Ym-1)

   LCS(Xn-1,Ym-1)就是原問題的一個子問題。為什么叫子問題?因為它的規模比原問題小。(小一個元素也是小嘛....)

   為什么是最優的子問題?因為我們要找的是Xn-1 和 Ym-1 的最長公共子序列啊。。。最長的!!!換句話說,就是最優的那個。(這里的最優就是最長的意思)

      2)如果xn != ym,這下要麻煩一點,因為它產生了兩個子問題:LCS(Xn-1,Ym) 和 LCS(Xn,Ym-1)

   因為序列X 和 序列Y 的最后一個元素不相等嘛,那說明最后一個元素不可能是最長公共子序列中的元素嘛。(都不相等了,怎么公共嘛)。

   LCS(Xn-1,Ym)表示:最長公共序列可以在(x1,x2,....x(n-1)) 和 (y1,y2,...yn)中找。

   LCS(Xn,Ym-1)表示:最長公共序列可以在(x1,x2,....xn) 和 (y1,y2,...y(n-1))中找。

   求解上面兩個子問題,得到的公共子序列誰最長,那誰就是 LCS(X,Y)。用數學表示就是:

   LCS=max{LCS(Xn-1,Ym),LCS(Xn,Ym-1)}

   由於條件 1)  和  2)  考慮到了所有可能的情況。因此,我們成功地把原問題 轉化 成了 三個規模更小的子問題。

 

  ②重疊子問題

   重疊子問題是啥?就是說原問題 轉化 成子問題后,  子問題中有相同的問題。咦?我怎么沒有發現上面的三個子問題中有相同的啊????

   OK,來看看,原問題是:LCS(X,Y)。子問題有 ❶LCS(Xn-1,Ym-1)    ❷LCS(Xn-1,Ym)    ❸LCS(Xn,Ym-1)

   初一看,這三個子問題是不重疊的。可本質上它們是重疊的,因為它們只重疊了一大部分。舉例:

   第二個子問題:LCS(Xn-1,Ym) 就包含了:問題❶LCS(Xn-1,Ym-1),為什么?

   因為,當Xn-1 和 Ym 的最后一個元素不相同時,我們又需要將LCS(Xn-1,Ym)進行分解:分解成:LCS(Xn-1,Ym-1) 和 LCS(Xn-2,Ym)

   也就是說:在子問題的繼續分解中,有些問題是重疊的。

 

   由於像LCS這樣的問題,它具有重疊子問題的性質,因此:用遞歸來求解就太不划算了。因為采用遞歸,它重復地求解了子問題啊。而且注意哦,所有子問題加起來的個數 可是指數級的哦。。。。

   這篇文章中就演示了一個遞歸求解重疊子問題的示例。

   那么問題來了,你說用遞歸求解,有指數級個子問題,故時間復雜度是指數級。這指數級個子問題,難道用了動態規划,就變成多項式時間了??

   呵呵噠。。。。

   關鍵是采用動態規划時,並不需要去一 一 計算那些重疊了的子問題。或者說:用了動態規划之后,有些子問題 是通過 “查表“ 直接得到的,而不是重新又計算一遍得到的。廢話少說:舉個例子吧!比如求Fib數列。關於Fib數列,可參考:

                

    求fib(5),分解成了兩個子問題:fib(4) 和 fib(3),求解fib(4) 和 fib(3)時,又分解了一系列的小問題....

    從圖中可以看出:根的左右子樹:fib(4) 和 fib(3)下,是有很多重疊的!!!比如,對於 fib(2),它就一共出現了三次。如果用遞歸來求解,fib(2)就會被計算三次,而用DP(Dynamic Programming)動態規划,則fib(2)只會計算一次,其他兩次則是通過”查表“直接求得。而且,更關鍵的是:查找求得該問題的解之后,就不需要再繼續去分解該問題了。而對於遞歸,是不斷地將問題分解,直到分解為 基准問題(fib(1) 或者 fib(0))

 

    說了這么多,還是要寫下最長公共子序列的遞歸式才完整。借用網友的一張圖吧:)

   

      

     c[i,j]表示:(x1,x2....xi) 和 (y1,y2...yj) 的最長公共子序列的長度。(是長度哦,就是一個整數嘛)。公式的具體解釋可參考《算法導論》動態規划章節

 

     這張DP表很是重要,從中我們可以窺見最長公共子序列的來源,同時可以根據這張表打印出最長公共子序列的構成路徑      

      

 

  這里是我丑陋又可AC的代碼(若碼風不好,見諒);

   

#include<bits/stdc++.h>
using namespace std;
const int N=1000+10;
int x[N],y[N],dp[N][N];

int main()
{
	string a,b;
	cin>>a>>b;
	int lena=a.length(),lenb=b.length();
	
	for(int i=1;i<=lena;i++)
	{
		for(int j=1;j<=lenb;j++)
		{
			if(a[i-1]==b[j-1])
				dp[i][j]=dp[i-1][j-1]+1;
			else
			{
				dp[i][j]=max(dp[i][j-1],dp[i-1][j]);
			}
		}
	}
	
	cout<<dp[lena][lenb]<<endl;
	
	return 0;
}

    好啦,結束啦.............................✿✿ヽ(°▽°)ノ✿   ✿✿ヽ(°▽°)ノ✿  

    記得給小胖妞 點贊 點贊  點贊.........


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM