最長公共子序列

本文轉載自查看原文 2020-04-07 21:39 1119

最長公共子序列

　　這可是板子題；

　　題目；

　　　　我當初面對這題的時候滿臉的問號，不是最長，還是公共的么，怎么會是3，怎么該也是2啊，有和我一樣疑問的小伙伴在評論區扣2，

　　　既然我說了這是板子題，那么這最長公共子序列都是這樣的定義，

　　　首先；

　　　　這個是一樣的吧，盤它，箭頭繼續指向下一個

　　　　到這字母就不一樣，繼續下一個，一直到

　　　　就是這樣，繼續的尋找，注意我的繼續下一個可不一定是連續的，注意啊，注意，這個繼續可是有選和不選的意味呢，說到這里，有聰明的朋友又知道了，是不是。。。。

　　　沒錯，這里我們可以使用dp，什么是最長公共子序列呢，就是順序的公共字母，可以存在空格和間隙，但是一定要是有序的。（蒟蒻見解，若有出入，誠邀指正）

　　　這里我用了一位大佬的文章，他寫的實在太好了，轉載於https://www.cnblogs.com/wkfvawl/p/9362287.html

　　一，問題描述

　　　　　　給定兩個字符串，求解這兩個字符串的最長公共子序列（Longest Common Sequence）。比如字符串1：BDCABA；字符串2：ABCBDAB

　　　則這兩個字符串的最長公共子序列長度為4，最長公共子序列是：BCBA

　　二，算法求解

　　　　　　這是一個動態規划的題目。對於可用動態規划求解的問題，一般有兩個特征：①最優子結構；②重疊子問題

　　①最優子結構

　　　設 X=(x1,x2,.....xn) 和 Y={y1,y2,.....ym} 是兩個序列，將 X 和 Y 的最長公共子序列記為LCS(X,Y)

　　　找出LCS(X,Y)就是一個最優化問題。因為，我們需要找到X 和 Y中最長的那個公共子序列。而要找X 和 Y的LCS，首先考慮X的最后一個元素和Y的最后一個元素。

　　　　　　1）如果 xn=ym，即X的最后一個元素與Y的最后一個元素相同，這說明該元素一定位於公共子序列中。因此，現在只需要找：LCS(X_n-1，Y_m-1)

　　　LCS(X_n-1，Y_m-1)就是原問題的一個子問題。為什么叫子問題？因為它的規模比原問題小。（小一個元素也是小嘛....）

　　　為什么是最優的子問題？因為我們要找的是X_n-1和 Y_m-1 的最長公共子序列啊。。。最長的！！！換句話說，就是最優的那個。（這里的最優就是最長的意思）

　　　　　　2）如果xn != ym，這下要麻煩一點，因為它產生了兩個子問題：LCS(X_n-1，Y_m) 和 LCS(X_n，Y_m-1)

　　　因為序列X 和序列Y 的最后一個元素不相等嘛，那說明最后一個元素不可能是最長公共子序列中的元素嘛。（都不相等了，怎么公共嘛）。

　　　LCS(X_n-1，Y_m)表示：最長公共序列可以在(x1,x2,....x(n-1)) 和 (y1,y2,...yn)中找。

　　　LCS(X_n，Y_m-1)表示：最長公共序列可以在(x1,x2,....xn) 和 (y1,y2,...y(n-1))中找。

　　　求解上面兩個子問題，得到的公共子序列誰最長，那誰就是 LCS（X,Y）。用數學表示就是：

　　　LCS=max{LCS(X_n-1，Y_m)，LCS(X_n，Y_m-1)}

　　　由於條件 1) 和 2) 考慮到了所有可能的情況。因此，我們成功地把原問題轉化成了三個規模更小的子問題。

　　②重疊子問題

　　　重疊子問題是啥？就是說原問題轉化成子問題后，子問題中有相同的問題。咦？我怎么沒有發現上面的三個子問題中有相同的啊？？？？

　　　OK，來看看，原問題是：LCS(X,Y)。子問題有 ❶LCS(X_n-1，Y_m-1) ❷LCS(X_n-1，Y_m) ❸LCS(X_n，Y_m-1)

　　　初一看，這三個子問題是不重疊的。可本質上它們是重疊的，因為它們只重疊了一大部分。舉例：

　　　第二個子問題：LCS(X_n-1，Y_m) 就包含了：問題❶LCS(X_n-1，Y_m-1)，為什么？

　　　因為，當X_n-1 和 Y_m 的最后一個元素不相同時，我們又需要將LCS(X_n-1，Y_m)進行分解：分解成：LCS(X_n-1，Y_m-1) 和 LCS(X_n-2，Y_m)

　　　也就是說：在子問題的繼續分解中，有些問題是重疊的。

　　　由於像LCS這樣的問題，它具有重疊子問題的性質，因此：用遞歸來求解就太不划算了。因為采用遞歸，它重復地求解了子問題啊。而且注意哦，所有子問題加起來的個數可是指數級的哦。。。。

　　　這篇文章中就演示了一個遞歸求解重疊子問題的示例。

　　　那么問題來了，你說用遞歸求解，有指數級個子問題，故時間復雜度是指數級。這指數級個子問題，難道用了動態規划，就變成多項式時間了？？

　　　呵呵噠。。。。

　　　關鍵是采用動態規划時，並不需要去一一計算那些重疊了的子問題。或者說：用了動態規划之后，有些子問題是通過 “查表“ 直接得到的，而不是重新又計算一遍得到的。廢話少說：舉個例子吧！比如求Fib數列。關於Fib數列，可參考：

　　　　求fib(5)，分解成了兩個子問題：fib(4) 和 fib(3)，求解fib(4) 和 fib(3)時，又分解了一系列的小問題....

　　　　從圖中可以看出：根的左右子樹：fib(4) 和 fib(3)下，是有很多重疊的！！！比如，對於 fib(2)，它就一共出現了三次。如果用遞歸來求解，fib(2)就會被計算三次，而用DP(Dynamic Programming)動態規划，則fib(2)只會計算一次，其他兩次則是通過”查表“直接求得。而且，更關鍵的是：查找求得該問題的解之后，就不需要再繼續去分解該問題了。而對於遞歸，是不斷地將問題分解，直到分解為基准問題(fib(1) 或者 fib(0))

　　　　說了這么多，還是要寫下最長公共子序列的遞歸式才完整。借用網友的一張圖吧：）

　　　　　c[i,j]表示：(x1,x2....xi) 和 (y1,y2...yj) 的最長公共子序列的長度。（是長度哦，就是一個整數嘛）。公式的具體解釋可參考《算法導論》動態規划章節

　　　　　這張DP表很是重要，從中我們可以窺見最長公共子序列的來源，同時可以根據這張表打印出最長公共子序列的構成路徑　　　　　　

　　這里是我丑陋又可AC的代碼（若碼風不好，見諒）；

#include<bits/stdc++.h>
using namespace std;
const int N=1000+10;
int x[N],y[N],dp[N][N];

int main()
{
	string a,b;
	cin>>a>>b;
	int lena=a.length(),lenb=b.length();
	
	for(int i=1;i<=lena;i++)
	{
		for(int j=1;j<=lenb;j++)
		{
			if(a[i-1]==b[j-1])
				dp[i][j]=dp[i-1][j-1]+1;
			else
			{
				dp[i][j]=max(dp[i][j-1],dp[i-1][j]);
			}
		}
	}
	
	cout<<dp[lena][lenb]<<endl;
	
	return 0;
}

　　　　好啦，結束啦.............................✿✿ヽ(°▽°)ノ✿ ✿✿ヽ(°▽°)ノ✿

　　　　記得給小胖妞點贊點贊點贊.........

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 最長公共子序列最長公共子序列和最長公共子串（dp）最長公共子串和最長公共子序列最長公共子序列python實現最長公共子序列__java實現最長公共子序列的長度，和構造最長公共子序列的長度 LCSS最長公共子序列算法最長公共子序列（LCS）最長公共子序列問題