動態規划是什么
動態規划(Dynamic Programming,DP)是運籌學的一個分支,是求解決策過程最優化的過程。20世紀50年代初,美國數學家貝爾曼(R.Bellman)等人在研究多階段決策過程的優化問題時,提出了著名的最優化原理,從而創立了動態規划。
我們把要解決的一個大問題轉換成若干個規模較小的同類型問題,當我們求解出這些小問題的答案,大問題便不攻自破。這就是動態規划。
看一個很經典的介紹 DP 的問題:
“How should i explain Dynamic Programming to a 4-year-old?“
writes down "1+1+1+1+1+1+1+1 =" on a sheet of paper
"What's that equal to?"
counting "Eight!"
writes down another "1+" on the left
"What about that?"
quickly "Nine!"
"How'd you know it was nine so fast?"
"You just added one more"
"So you didn't need to recount because you remembered there were eight! Dynamic Programming is just a fancy way to say 'remembering stuff to save time later'"
這個估計大家都能看懂,就不解釋了。動態規划其實就是把要解決的一個大問題轉換成若干個規模較小的同類型問題。那這里的關鍵在於小問題的答案,可以進行重復使用,比如經典的爬樓梯問題。
這種思想的本質是:一個規模較大的問題(可以用兩三個參數表示),通過若干規模較小的問題的結果來得到的(通常會尋求到一些特殊的計算邏輯,如求最值等)
我們一般看到的狀態轉移方程,基本類似下面的公式(注:i、j、k 都是在定義DP方程中用到的參數。opt 指代特殊的計算邏輯,大多數情況下為 max 或 min。func 指代邏輯函數):
- dp[i] = opt(dp[i-1])+1
- dp[i][j] = func(i,j,k) + opt(dp[i-1][k])
- dp[i][j] = opt(dp[i-1][j-1],dp[i-1][j])+arr[i][j]
- dp[i][j] = opt(dp[i-1][j] + xi, dp[i][j-1] + yj, ...)
- ...
基本思路
動態規划是一個求最值的過程,既然是要求最值,核心問題是什么呢?求解動態規划的核心問題是窮舉。因為要求最值,肯定要把所有可行的答案窮舉出來,然后在其中找最值。
首先,動態規划的窮舉有點特別,因為這類問題存在“重疊子問題”,如果暴力窮舉的話效率會極其低下,所以需要“備忘錄”或者“DP table”來優化窮舉過程,避免不必要的計算。
而且,動態規划問題一定會具備“最優子結構”,才能通過子問題的最值得到原問題的最值。
最后,雖然動態規划的核心思想就是窮舉求最值,但是問題可以千變萬化,窮舉所有可行解其實並不是一件容易的事,只有列出正確的“狀態轉移方程”才能正確地窮舉。
整體框架
- 狀態轉移方程
- 備忘錄存儲重復子問題
- 最小子問題
- 求最值
斐波那契數列
斐波那契數列不算動態規划,但是解決問題的思路與動態規划很像,再加上大家上學的時候基本都接觸過斐波那契數列,通過它來理解動態規划就很不錯了。
斐波那契數列的數學形式就是遞歸的,寫成代碼就是這樣:
int fib(int N) {
if (N == 1 || N == 2) return 1;
return fib(N - 1) + fib(N - 2);
}
這個遞歸,相信有不少人能看出問題,子問題被不斷計算,以N=20為例
fib(20) = fib(19) + fib(18) = fib(18) + fib(17) + fib(18)
寫到這里,已經發現,fib(18)已經被計算多次,效率很低下。
所以引入帶備忘錄的遞歸算法,把每次計算的子結果的值進行存儲,后面就不需要重復計算了。整改之后的代碼
int fib(int N) {
int[] dp = int int[N];
// 最小子問題
dp[1] = dp[2] = 1;
for (int i = 3; i <= N; i++) {
// 狀態轉移方程
dp[i] = dp[i - 1] + dp[i - 2];
}
return dp[N];
}
例子:最長回文串
問題:給定一個字符串 s,找到 s 中最長的回文子串。你可以假設 s 的最大長度為 1000。
輸入: "babad"
輸出: "bab"
注意: "aba" 也是一個有效答案。
思路:對於一個子串而言,如果它是回文串,並且長度大於2,那么將它首尾的兩個字母去除之后,它仍然是個回文串。例如對於字符串“ababa”,如果我們已經知道“bab” 是回文串,那么“ababa” 一定是回文串,這是因為它的首尾兩個字母都是“a”。
於是得到我們的狀態轉移方程:
dp[i][j] 表示i到j之間的字符串是否是回文串
dp[i][j] = dp[i+1][j-1] and (s[i] eq s[j])
最小子問題:當s[i] eq s[j],子串長度是2或3,不需要檢查子串是否回文串,即j-i<=2
public String longestPalindrome(String s) {
if (s == null || s.length() <= 1) {
return s;
}
int len = s.length();
int maxLen = 1;
int left = 0;
int right = 0;
boolean[][] dp = new boolean[len][len];
char[] chars = s.toCharArray();
// 如果i從0開始,那么對應abba這樣的字符串,bb這個子串在遍歷過程中沒法被當做子問題進行存儲
for (int i=len-2; i>=0; i--) {
for (int j=i+1; j<len; j++) {
if (chars[i] == chars[j]) {
if (j-i <= 2) { // 最小字問題
if (j-i+1 > maxLen) {
maxLen = j-i+1;
left = i;
right = j;
}
dp[i][j] = true;
}else if (dp[i+1][j-1]) { // 子問題
if (j-i+1 > maxLen) {
maxLen = j-i+1;
left = i;
right = j;
}
dp[i][j] = true;
}
}
}
}
return s.substring(left, right + 1);
}