用暴力遞歸解法推導出動態規划

本文轉載自查看原文 2020-08-21 10:06 725 暴力遞歸/ 數據結構與算法/ 動態規划/ 算法筆記

1 暴力遞歸到動態規划

1 暴力遞歸到動態規划

本篇是算法基礎筆記的最后一篇，前面所記錄的和該篇共同覆蓋了平時刷題常用的數據結構和算法，之后就是通過刷題量來鞏固所學的內容。接下來我准備針對基礎數據結構和算法做一些刷題記錄，主要是分類別刷leetcode上的題，傳送門為：https://github.com/Dairongpeng/leetcode 一起刷題吧^_。

轉載注明出處，源碼地址： https://github.com/Dairongpeng/algorithm-note ，歡迎star

動態規划最核心的是暴力遞歸的嘗試過程，一旦通過嘗試寫出來暴力遞歸的解法，那么動態規划在此基礎上就很好改了

1、暴力遞歸之所以暴力，是因為存在大量的重復計算。加入我們定義我們的緩存結構，用來查該狀態有沒有計算過，那么會加速我們的遞歸

2、在我們加入緩存結構之后，消除了大量的重復計算，緩存表就是我們的dp表。那么這種去除重復計算的遞歸，就是最粗糙的動態規划，也叫記憶化搜索

3、如果我們把我們的dp表，從簡單到復雜列出來，那么就是經典的動態規划。我們無需考慮轉移方程怎么寫，而是根據我們的遞歸來推導。看下面例子：

1.1 例一 : 機器人運動問題(2018阿里面試題目)

認識暴力遞歸改動態規划的過程

假設有排成一行的N個位置，記為1_{N,N一定大於等於2。開始時機器人在其中的M位置上（M一定是1}N中的一個）。

如果機器人來到1位置，那么下一步只能往右來到2位置；

如果機器人來到N位置，那么下一步只能往左來到N-1的位置；

如果機器人來到中間位置，那么下一步可以往左走或者往右走；

規定機器人必須走K步，最終能來到P位置（P也是1~N中的一個）的方法有多少種？

給定四個參數N,M,K,P。返回方法數

暴力遞歸ways1調用的walk函數，就是暴力遞歸過程，存在重復計算。waysCache方法對應的walkCache就是在純暴力遞歸的基礎上加了緩存

假設我們的參數N=7，M=2,K=5,P=3。我們根據我們的遞歸加緩存的過程來填我們的dp表：

1、int[][] dp = new int[N+1][K+1];是我們的DP表的范圍

2、當rest = 0的時候，dp[cur][rest] = cur == P ? 1 : 0; 我們只有cur=P的時候為1,其他位置都為0。

3、當cur=1的時候，dp[cur][rest] = walkCache(N, 2, rest - 1, P, dp); 我們的dp當前的值，依賴於cur的下一個位置，rest的上一個位置

4、當cur = N的時候，dp[cur][rest] =walkCache(N, N - 1, rest - 1, P,dp); 我們dp當前位置依賴於N-1位置，和rest - 1位置

5、當cur在任意中間位置時。dp[cur][rest] = walkCache(N, cur + 1, rest - 1, P,dp) + walkCache(N, cur - 1, rest - 1, P, dp); dp的當前位置依賴於dp的cur+1和rest-1位置加上dp的cur-1和rest-1的位置

那么我們可以得到我們的DP表為：


    0   1   2   3   4   5   K 坐標
0   x   x   x   x   x   x

1   0   0   1   0   3   0

2   0   1   0   3   0   9

3   1   0   2   0   6   0

4   0   1   0   3   0   10

5   0   0   1   0   5   0

6   0   0   0   1   0   5

7   0   0   0   0   1   0

cur
坐
標

所以任何的動態規划，都可以由暴力遞歸改出來。也就是所任意的動態規划都來自於某個暴力遞歸。反之任何暴力遞歸不一定能改成動態規划，jia'ru某暴力遞歸並沒有重復計算，沒有緩存的必要

動態規划實質就是把參數組合完成結構化的緩存

package class12;

public class Code01_RobotWalk {

	public static int ways1(int N, int M, int K, int P) {
		// 參數無效直接返回0
		if (N < 2 || K < 1 || M < 1 || M > N || P < 1 || P > N) {
			return 0;
		}
		// 總共N個位置，從M點出發，還剩K步可以走，返回最終能達到P的方法數
		return walk(N, M, K, P);
	}

	// N : 位置為1 ~ N，固定參數
	// cur : 當前在cur位置，可變參數
	// rest : 還剩res步沒有走，可變參數
	// P : 最終目標位置是P，固定參數
	// 該函數的含義：只能在1~N這些位置上移動，當前在cur位置，走完rest步之后，停在P位置的方法數作為返回值返回
	public static int walk(int N, int cur, int rest, int P) {
		// 如果沒有剩余步數了，當前的cur位置就是最后的位置
		// 如果最后的位置停在P上，那么之前做的移動是有效的
		// 如果最后的位置沒在P上，那么之前做的移動是無效的
		if (rest == 0) {
			return cur == P ? 1 : 0;
		}
		// 如果還有rest步要走，而當前的cur位置在1位置上，那么當前這步只能從1走向2
		// 后續的過程就是，來到2位置上，還剩rest-1步要走
		if (cur == 1) {
			return walk(N, 2, rest - 1, P);
		}
		// 如果還有rest步要走，而當前的cur位置在N位置上，那么當前這步只能從N走向N-1
		// 后續的過程就是，來到N-1位置上，還剩rest-1步要走
		if (cur == N) {
			return walk(N, N - 1, rest - 1, P);
		}
		// 如果還有rest步要走，而當前的cur位置在中間位置上，那么當前這步可以走向左，也可以走向右
		// 走向左之后，后續的過程就是，來到cur-1位置上，還剩rest-1步要走
		// 走向右之后，后續的過程就是，來到cur+1位置上，還剩rest-1步要走
		// 走向左、走向右是截然不同的方法，所以總方法數要都算上
		return walk(N, cur + 1, rest - 1, P) + walk(N, cur - 1, rest - 1, P);
	}
	
	public static int waysCache(int N, int M, int K, int P) {
		// 參數無效直接返回0
		if (N < 2 || K < 1 || M < 1 || M > N || P < 1 || P > N) {
			return 0;
		}
		
		// 我們准備一張緩存的dp表
		// 由於我們的cur范圍是1~N，我們准備N+1。
		// rest范圍在1~K。我們准備K+1。
		// 目的是把我們的可能結果都能裝得下
		int[][] dp = new int[N+1][K+1];
		// 設置這張表的初始值都為-1，代表都還沒用過
		for(int row = 0; row <= N; row++) {
			for(int col = 0; col <= K; col++) {
				dp[row][col] = -1;
			}
		}
		return walkCache(N, M, K, P,dp);
	}

	// HashMap<String, Integer>   (19,100)  "19_100"
	// 我想把所有cur和rest的組合，返回的結果，加入到緩存里
	public static int walkCache(int N, int cur, int rest, int P, int[][] dp) {
	        // 當前場景已經計算過，不要再暴力展開，直接從緩存中拿
		if(dp[cur][rest] != -1) {
			return dp[cur][rest];
		}
		if (rest == 0) {
		        // 先加緩存
			dp[cur][rest] = cur == P ? 1 : 0;
			return dp[cur][rest];
		}
		if (cur == 1) {
		        // 先加緩存
			dp[cur][rest] = walkCache(N, 2, rest - 1, P, dp);
			return dp[cur][rest];
		}
		if (cur == N) {
		        // 先加緩存
			dp[cur][rest] =walkCache(N, N - 1, rest - 1, P,dp);
			return dp[cur][rest];
		}
		// 先加緩存
		dp[cur][rest] = walkCache(N, cur + 1, rest - 1, P,dp) 
				+ walkCache(N, cur - 1, rest - 1, P, dp);
		return dp[cur][rest];
	}
	
	public static int ways2(int N, int M, int K, int P) {
		// 參數無效直接返回0
		if (N < 2 || K < 1 || M < 1 || M > N || P < 1 || P > N) {
			return 0;
		}
		int[][] dp = new int[K + 1][N + 1];
		dp[0][P] = 1;
		for (int i = 1; i <= K; i++) {
			for (int j = 1; j <= N; j++) {
				if (j == 1) {
					dp[i][j] = dp[i - 1][2];
				} else if (j == N) {
					dp[i][j] = dp[i - 1][N - 1];
				} else {
					dp[i][j] = dp[i - 1][j - 1] + dp[i - 1][j + 1];
				}
			}
		}
		return dp[K][M];
	}

	public static int ways3(int N, int M, int K, int P) {
		// 參數無效直接返回0
		if (N < 2 || K < 1 || M < 1 || M > N || P < 1 || P > N) {
			return 0;
		}
		int[] dp = new int[N + 1];
		dp[P] = 1;
		for (int i = 1; i <= K; i++) {
			int leftUp = dp[1];// 左上角的值
			for (int j = 1; j <= N; j++) {
				int tmp = dp[j];
				if (j == 1) {
					dp[j] = dp[j + 1];
				} else if (j == N) {
					dp[j] = leftUp;
				} else {
					dp[j] = leftUp + dp[j + 1];
				}
				leftUp = tmp;
			}
		}
		return dp[M];
	}

	// ways4是你的方法
	public static int ways4(int N, int M, int K, int P) {
		if (N < 2 || K < 1 || M < 1 || M > N || P < 1 || P > N) {
			return 0;
		}
		return process(N, 0, P, M, K);
	}

	// 一共N個位置，從M點出發，一共只有K步。返回走到位置j，剩余步數為i的方法數
	public static int process(int N, int i, int j, int M, int K) {
		if (i == K) {
			return j == M ? 1 : 0;
		}
		if (j == 1) {
			return process(N, i + 1, j + 1, M, K);
		}
		if (j == N) {
			return process(N, i + 1, j - 1, M, K);
		}
		return process(N, i + 1, j + 1, M, K) + process(N, i + 1, j - 1, M, K);
	}

	// ways5是你的方法的dp優化
	public static int ways5(int N, int M, int K, int P) {
		if (N < 2 || K < 1 || M < 1 || M > N || P < 1 || P > N) {
			return 0;
		}
		int[][] dp = new int[K + 1][N + 1];
		dp[K][M] = 1;
		for (int i = K - 1; i >= 0; i--) {
			for (int j = 1; j <= N; j++) {
				if (j == 1) {
					dp[i][j] = dp[i + 1][j + 1];
				} else if (j == N) {
					dp[i][j] = dp[i + 1][j - 1];
				} else {
					dp[i][j] = dp[i + 1][j + 1] + dp[i + 1][j - 1];
				}
			}
		}
		return dp[0][P];
	}

	public static void main(String[] args) {
		System.out.println(ways1(7, 4, 9, 5));
		System.out.println(ways2(7, 4, 9, 5));
		System.out.println(ways3(7, 4, 9, 5));
		System.out.println(ways4(7, 4, 9, 5));
		System.out.println(ways5(7, 4, 9, 5));
	}

}

1.2 例二：背包問題改動態規划

暴力遞歸過程中，我們如何組織我們的決策過程。實質就是動態規划的狀態轉移

package class12;

public class Code03_Knapsack {

	public static int getMaxValue(int[] w, int[] v, int bag) {
	        // 主函數需要0 bag的返回值
		return process(w, v, 0, 0, bag);
	}

	// index... 最大價值
	public static int process(int[] w, int[] v, int index, int alreadyW, int bag) {
		if (alreadyW > bag) {
			return -1;
		}
		// 重量沒超
		if (index == w.length) {
			return 0;
		}
		int p1 = process(w, v, index + 1, alreadyW, bag);
		int p2next = process(w, v, index + 1, alreadyW + w[index], bag);
		int p2 = -1;
		if (p2next != -1) {
			p2 = v[index] + p2next;
		}
		return Math.max(p1, p2);

	}

	public static int maxValue(int[] w, int[] v, int bag) {
		return process(w, v, 0, bag);
	}

	// 只剩下rest的空間了，
	// index...貨物自由選擇，但是不要超過rest的空間
	// 返回能夠獲得的最大價值
	public static int process(int[] w, int[] v, int index, int rest) {
		if (rest < 0) { // base case 1
			return -1;
		}
		// rest >=0
		if (index == w.length) { // base case 2
			return 0;
		}
		// 有貨也有空間
		int p1 = process(w, v, index + 1, rest);
		int p2 = -1;
		int p2Next = process(w, v, index + 1, rest - w[index]);
		if(p2Next!=-1) {
			p2 = v[index] + p2Next;
		}
		return Math.max(p1, p2);
	}

        // dpWay就是把上述的暴力遞歸改為動態規划
	public static int dpWay(int[] w, int[] v, int bag) {
		int N = w.length;
		// 准備一張dp表，行號為我們的重量范圍。列為我們的價值范圍
		int[][] dp = new int[N + 1][bag + 1];
		// 由於暴力遞歸中index==w.length的時候，總是返回0。所以：
		// dp[N][...] = 0。整形數組初始化為0，無需處理
		// 由於N行已經初始化為0，我們從N-1開始。填我們的dp表
		for (int index = N - 1; index >= 0; index--) {
		        // 剩余空間從0開始，一直填寫到bag
			for (int rest = 0; rest <= bag; rest++) { // rest < 0
			
			    // 通過正常位置的遞歸處理
			    // 我們轉而填寫dp表格,注釋位置是正常遞歸處理
			    
		//	    int p1 = process(w, v, index + 1, rest);
		//        int p2 = -1;
		//        int p2Next = process(w, v, index + 1, rest - w[index]);
		//        if(p2Next!=-1) {
		//	        p2 = v[index] + p2Next;
		//        }
		//        return Math.max(p1, p2);
			    
			        // 所以我們p1等於dp表的下一層向上一層返回
				int p1 = dp[index+1][rest];
				int p2 = -1;
				// rest - w[index] 不越界
				if(rest - w[index] >= 0) {
					p2 = v[index] + dp[index + 1][rest - w[index]];
				}
				// p1和p2取最大值
				dp[index][rest] = Math.max(p1, p2);
				
			}
		}
		// 最終返回dp表的0，bag位置，就是我們暴力遞歸的主函數調用
		return dp[0][bag];
	}

	public static void main(String[] args) {
		int[] weights = { 3, 2, 4, 7 };
		int[] values = { 5, 6, 3, 19 };
		int bag = 11;
		System.out.println(maxValue(weights, values, bag));
		System.out.println(dpWay(weights, values, bag));
	}

}

1.3 動態規划解題思路

1、拿到題目先找到某一個暴力遞歸的寫法（嘗試）

2、分析我們的暴力遞歸，是否存在重復解。沒有重復解的遞歸沒必要改動態規划

3、把暴力遞歸中的可變參數，做成緩存結構，不講究組織。即沒算過加入緩存結構，算過的直接拿緩存，就是記憶化搜索

4、如果把緩存結構做精細化組織，就是我們經典的動態規划

5、以背包問題舉例，我們每一個重量有要和不要兩個選擇，且都要遞歸展開。那么我們的遞歸時間復雜度尾O(2^N)。而記憶化搜索，根據可變參數得到的長為N價值為W的二維表，那么我們的時間復雜度為O(N*bag)。如果遞歸過程中狀態轉移有化簡繼續優化的可能，例如枚舉。那么經典動態規划可以繼續優化，否則記憶化搜索和動態規划的時間復雜度是一樣的

1.3.1 湊貨幣問題（重要）

該題是對動態規划完整優化路徑的演示

有一個表示貨幣面值的數組arr，每種面值的貨幣可以使用任意多張。arr數組元素為正數，且無重復值。例如[7,3,100,50]這是四種面值的貨幣。

問：給定一個特定金額Sum，我們用貨幣面值數組有多少種方法，可以湊出該面值。例如P=1000,用這是四種面值有多少種可能湊出1000

ways1為暴力遞歸的解題思路及實現

ways2為暴力遞歸改記憶化搜索的版本

ways3為記憶化搜索版本改動態規划的版本

package class12;

public class Code09_CoinsWay {

	// arr中都是正數且無重復值，返回組成aim的方法數，暴力遞歸
	public static int ways1(int[] arr, int aim) {
		if (arr == null || arr.length == 0 || aim < 0) {
			return 0;
		}
		return process1(arr, 0, aim);
	}

	public static int process1(int[] arr, int index, int rest) {
	        // base case
	        // 當在面值數組的arr.length，此時越界，沒有貨幣可以選擇。
	        // 如果當前目標金額就是0，那么存在一種方法，如果目標金額不為0，返回0中方法
		if(index == arr.length) {
			return rest == 0 ? 1 : 0 ;	
		}
		
		// 普遍位置
		int ways = 0;
		// 從0號位置開始枚舉，選擇0張，1張，2張等
		// 條件是張數乘以選擇的面值，不超過木匾面值rest
		for(int zhang = 0;  zhang * arr[index] <= rest ;zhang++) {
		    // 方法數加上除去當前選擇后所剩面額到下一位置的選擇數，遞歸
			ways += process1(arr, index + 1, rest -  (zhang * arr[index])  );
		}
		return ways;
	}


        // ways1暴力遞歸，改為記憶化搜索。ways2為記憶化搜索版本
	public static int ways2(int[] arr, int aim) {
		if (arr == null || arr.length == 0 || aim < 0) {
			return 0;
		}
		// 緩存結構，且只和index和rest有關，跟arr無關
		int[][] dp = new int[arr.length+1][aim+1];
		// 一開始所有的過程，都沒有計算呢，dp二維表初始化為-1
		// dp[..][..]  = -1
		for(int i = 0 ; i < dp.length; i++) {
			for(int j = 0 ; j < dp[0].length; j++) {
				dp[i][j] = -1;
			}
		}
		// 緩存結構向下傳遞
		return process2(arr, 0, aim , dp);
	}
	
	// 如果index和rest的參數組合，是沒算過的，dp[index][rest] == -1
	// 如果index和rest的參數組合，是算過的，dp[index][rest]  > - 1
	public static int process2(int[] arr, 
			int index, int rest,
			int[][] dp) {
		if(dp[index][rest] != -1) {
			return dp[index][rest];
		}
		if(index == arr.length) {
			dp[index][rest] = rest == 0 ? 1 :0;
			return  dp[index][rest];	
		}
		int ways = 0;
		for(int zhang = 0;  zhang * arr[index] <= rest ;zhang++) {
		        // 返回之前加入緩存
			ways += process2(arr, index + 1, rest -  (zhang * arr[index]) , dp );
		}
		// 返回之前加入緩存
		dp[index][rest] = ways;
		return ways;
	}
	
	// 記憶化搜索改造為動態規划版本，ways3。
	// 如果沒有枚舉行為，該動態該規划為自頂向下的動態規划和記憶化搜索等效，但這題存在枚舉行為。
	public static int ways3(int[] arr, int aim) {
		if (arr == null || arr.length == 0 || aim < 0) {
			return 0;
		}
		int N = arr.length;
		// dp表
		int[][] dp = new int[N + 1][aim + 1];
		// 根據遞歸方法，N為arr的越界位置，但是我們的dp表定義的是N+1。
		// N位置，如果aim為0，則dp[N][0] = 1;
		dp[N][0] = 1;// dp[N][1...aim] = 0;
		
		// 每個位置依賴自己下面的位置，那么我們從下往上循環
		for(int index = N - 1; index >= 0; index--) {
		    // rest從左往右
			for(int rest = 0; rest <= aim; rest++) {
				int ways = 0;
				for(int zhang = 0;  zhang * arr[index] <= rest ;zhang++) {
					ways += dp[index + 1] [rest -  (zhang * arr[index])];
				}
				dp[index][rest] = ways;
			}
		}
		// 最終我們需要[0,aim]位置的解
		return dp[0][aim];
	}
	
	// 由於存在枚舉行為，我們可以進一步優化我們的動態規划。ways4是優化的動態規划
	// 根據枚舉，用具體化例子來找出規律，省掉枚舉
	public static int ways4(int[] arr, int aim) {
		if (arr == null || arr.length == 0 || aim < 0) {
			return 0;
		}
		int N = arr.length;
		int[][] dp = new int[N + 1][aim + 1];
		dp[N][0] = 1;// dp[N][1...aim] = 0;
		for(int index = N - 1; index >= 0; index--) {
			for(int rest = 0; rest <= aim; rest++) {
				dp[index][rest] = dp[index+1][rest];
				if(rest - arr[index] >= 0) {
					dp[index][rest] += dp[index][rest - arr[index]];
				}
			}
		}
		return dp[0][aim];
	}
	

	public static void main(String[] args) {
		int[] arr = { 5, 10,50,100 };
		int sum = 1000;
		System.out.println(ways1(arr, sum));
		System.out.println(ways2(arr, sum));
		System.out.println(ways3(arr, sum));
		System.out.println(ways4(arr, sum));
	}

}

1.3.2 貼紙問題

給定一個字符串str，給定一個字符串類型的數組arr。arr里的每一個字符串，代表一張貼紙，你可以把單個字符剪開使用，目的是拼出str來。

返回需要至少多少張貼紙可以完成這個任務。

例如：str="babac"，arr={"ba","c","abcd"}

至少需要兩張貼紙"ba"和"abcd"，因為使用這兩張貼紙，把每一個字符串單獨剪開，含有2個a，2個b，1個c。是可以拼出str的，所以返回2。

思路1 minStickers1：由於任何貼紙都可以剪切的很碎，跟貼紙的順序沒關系。那么目標str我們先進行排序，那么也不會有影響。babac排序為aabbc，我們再去選擇貼紙，str被貼紙貼好后，剩下的接着排序，再選擇......

由於我們的可變參數，只有一個目標字符串。但是目標字符串的可能性太多，沒辦法精細化動態規划。傻緩存的暴力遞歸已經是最優解了。所以只有一個可變參數，又存在重復解，那么傻緩存就是最優解。

思路2 minStickers2，我們每一張貼紙枚舉所有可能的張數，后續過程不再考慮這張貼紙。但是方法一會好一點，因為只有一個可變參數。而方法二有兩個可變參數，我們在設計遞歸的時候，盡量少的使用可變參數，這樣我們緩存結構的命中率會提升

package class12;

import java.util.Arrays;
import java.util.HashMap;

public class Code02_StickersToSpellWord {

        // 暴力遞歸加緩存dp
	public static int minStickers1(String[] stickers, String target) {
		
		int n = stickers.length;
		// stickers -> [26] [26] [26]
		// 表示把每張貼紙轉化為26個字母的詞頻數組
		int[][] map = new int[n][26];
		// 把每一張貼紙轉化的字母26個字母有多少個
		for (int i = 0; i < n; i++) {
			char[] str = stickers[i].toCharArray();
			for (char c : str) {
				map[i][c - 'a']++;
			}
		}
		
		HashMap<String, Integer> dp = new HashMap<>();
		dp.put("", 0);
		return process1(dp, map, target);
	}

	// dp 傻緩存，如果rest已經算過了，直接返回dp中的值
	// rest 剩余的目標
	// 0..N每一個字符串所含字符的詞頻統計
	// 返回值是-1，map 中的貼紙  怎么都無法rest
	public static int process1(
			HashMap<String, Integer> dp,
			int[][] map, 
			String rest) {
		if (dp.containsKey(rest)) {
			return dp.get(rest);
		}
		// 以下就是正式的遞歸調用過程
		int ans = Integer.MAX_VALUE; // ans -> 搞定rest，使用的最少的貼紙數量 
		int n = map.length; // N種貼紙
		int[] tmap = new int[26]; // tmap 去替代 rest
		// 把目標target剩余的rest進行詞頻統計
		char[] target = rest.toCharArray();
		for (char c : target) {
			tmap[c - 'a']++;
		}
		
		// map表示所有貼紙的詞頻信息，tmap表示目標字符串的詞頻信息
		// 用map去覆蓋tmap
		for (int i = 0; i < n; i++) {
			// 枚舉當前第一張貼紙是誰？
			// 第一張貼紙必須包含當前目標字符串的首字母。和所有貼紙去選等效
			// 目的是讓當前貼紙的元素有在目標字符串的對應個，否則試過之后仍然是原始串，棧會溢出
			if (map[i][target[0] - 'a'] == 0) {
				continue;
			}
			StringBuilder sb = new StringBuilder();
			// i 貼紙， j 枚舉a~z字符
			for (int j = 0; j < 26; j++) { // 
				if (tmap[j] > 0) { // j這個字符是target需要的
					for (int k = 0; k < Math.max(0, tmap[j] - map[i][j]); k++) {
					    // 添加剩余
						sb.append((char) ('a' + j));
					}
				}
			}
			// sb ->  i 此時s就是當前貼紙搞定之后剩余的
			String s = sb.toString();
			// tmp是后續方案需要的貼紙數
			int tmp = process1(dp, map, s);
			// 如果-1表示貼紙怎么都無法覆蓋目標字符串
			if (tmp != -1) {
			    // 不是-1，最終返回當前后續貼紙數，加上當前貼紙數與ans的最小值
				ans = Math.min(ans, 1 + tmp);
			}
		}
		// 經過上述循環，ans仍然系統最大，表示怎么都無法覆蓋rest，返回-1
		dp.put(rest, ans == Integer.MAX_VALUE ? -1 : ans);
		return dp.get(rest);
	}


    
	public static int minStickers2(String[] stickers, String target) {
		int n = stickers.length;
		int[][] map = new int[n][26];
		for (int i = 0; i < n; i++) {
			char[] str = stickers[i].toCharArray();
			for (char c : str) {
				map[i][c - 'a']++;
			}
		}
		char[] str = target.toCharArray();
		int[] tmap = new int[26];
		for (char c : str) {
			tmap[c - 'a']++;
		}
		HashMap<String, Integer> dp = new HashMap<>();
		int ans = process2(map, 0, tmap, dp);
		return ans;
	}

	public static int process2(int[][] map, int i, int[] tmap, HashMap<String, Integer> dp) {
		StringBuilder keyBuilder = new StringBuilder();
		keyBuilder.append(i + "_");
		for (int asc = 0; asc < 26; asc++) {
			if (tmap[asc] != 0) {
				keyBuilder.append((char) (asc + 'a') + "_" + tmap[asc] + "_");
			}
		}
		String key = keyBuilder.toString();
		if (dp.containsKey(key)) {
			return dp.get(key);
		}
		boolean finish = true;
		for (int asc = 0; asc < 26; asc++) {
			if (tmap[asc] != 0) {
				finish = false;
				break;
			}
		}
		if (finish) {
			dp.put(key, 0);
			return 0;
		}
		if (i == map.length) {
			dp.put(key, -1);
			return -1;
		}
		int maxZhang = 0;
		for (int asc = 0; asc < 26; asc++) {
			if (map[i][asc] != 0 && tmap[asc] != 0) {
				maxZhang = Math.max(maxZhang, (tmap[asc] / map[i][asc]) + (tmap[asc] % map[i][asc] == 0 ? 0 : 1));
			}
		}
		int[] backup = Arrays.copyOf(tmap, tmap.length);
		int min = Integer.MAX_VALUE;
		int next = process2(map, i + 1, tmap, dp);
		tmap = Arrays.copyOf(backup, backup.length);
		if (next != -1) {
			min = next;
		}
		for (int zhang = 1; zhang <= maxZhang; zhang++) {
			for (int asc = 0; asc < 26; asc++) {
				tmap[asc] = Math.max(0, tmap[asc] - (map[i][asc] * zhang));
			}
			next = process2(map, i + 1, tmap, dp);
			tmap = Arrays.copyOf(backup, backup.length);
			if (next != -1) {
				min = Math.min(min, zhang + next);
			}
		}
		int ans = min == Integer.MAX_VALUE ? -1 : min;
		dp.put(key, ans);
		return ans;
	}
	
	public static void main(String[] args) {
		String[] arr = {"aaaa","bbaa","ccddd"};
		String str = "abcccccdddddbbbaaaaa";
		System.out.println(minStickers1(arr, str));
		System.out.println(minStickers2(arr, str));
		
		
	}

}

1.4 什么暴力遞歸可以繼續優化？

1、有重復調用同一個子問題的解，這種遞歸可以優化

2、如果每一個子問題都是不同的解，無法優化也不用優化

1.5 暴力遞歸和動態規划的關系

1、某個暴力遞歸，有解的重復調用，就可以把這個暴力遞歸優化成動態規划

2、任何動態規划問題，都一定對應着某一個有解的重復調用的暴力遞歸

3、不是所有的暴力遞歸，都一定對應着動態規划

1.6 面試題中和動態規划的關系

1、解決一個問題，可能有很多嘗試方法

2、可能在很多嘗試方法中，又有若干個嘗試方法有動態規划的方式

3、一個問題，可能有若干種動態規划的解法

1.7 如何找到某個問題的動態規划方式？

1、設計暴力遞歸：重要原則+4中常見嘗試模型！重點

2、分析有沒有重復解：套路解決

3、用記憶化搜索 -> 用嚴格表結構實現動態規划：套路解決

4、看看能否繼續優化：套路解決

1.8 面試中設計暴力遞歸過程的原則

怎么猜是不對的？

1、每一個可變參數，一定不要比int類型更加復雜

比如可變參數是int a和int b 那么我們的緩存結構可以是a*b的二維數組。大小取決於a和b的范圍

但是如果我們的可變參數是一個數組，int[] a。那么如果過多，我們不太容易設計那么大的緩存結構。如果只有一個這種可變參數就是原則2

不管什么問題，我們在腦海中想象可變參數就不會突破整形范圍

2、原則1可以違反，讓類型突破到一維線性結構，那必須是唯一可變參數。例如上述貼紙問題

3、如果發現原則1被違反，但沒違反原則2。只需要做到記憶化搜索就是最優解

3、可變參數個數，能少則少

1.9 筆試面試過程中怎么設計暴力遞歸？

1、一定逼自己找到不違反1.8原則情況下的暴力嘗試！

2、如果你找到暴力嘗試，不符合原則，馬上舍棄，找新的！

3、如果某個題目突破了設計原則，一定極難極難，面試中出現的概率低於5%

1.10 常見的4種嘗試模型

每一個模型背后都有很多題目

1.10.1 從左往右的嘗試模型

例如背包問題

1.10.2 范圍上的嘗試模型

例如紙牌博弈問題

1.10.3 多樣本位置全對應的嘗試模型

1.10.3.1 兩個字符串的最長公共子序列問題

例如“ab1cd2ef345gh”和“opq123rs4tx5yz”的最長公共子序列為“12345”。即在兩個字符串所有相等的子序列里最長的。所以返回子序列的長度5

假如"a123bc"和"12dea3fz"兩個字符串，我們把這兩個樣本的下標一個作為行，一個作為列。觀察這樣的結構所表示的意義。dp表這樣設計就是str1從0到i位置，str2從0到j位置，兩個位置的最長公共子序列。

dp[i][j] 表示的含義是，str1字符串在i位置，
str2在j位置，兩個最長公共子序列多長。
那么str1和str2的最長公共子序列，就是dp[str1.length][str2.length]

對於任何位置dp[i][j]:

如果str1的i位置和str2的j位置的最長公共子序列跟str1的i位置字符和str2的j位置字符無關，那么此時的最長公共子序列長度就是dp[i-1][j-1]

此時與str1的i位置結尾的字符有關系，和str2的j位置結尾的字符沒關系。此時跟str2的j位置沒關系，最長公共子序列式dp[i][j-1]

此時與str1的i位置結尾的字符沒關系，和str2的j位置結尾的字符有關系。此時跟str1的j位置沒關系，最長公共子序列式dp[i-1][j]

此時即與str1的i字符結尾，有關系。又與str2的j位置結尾，有關系。只有str1[i]==str2[j]才有可能存在這種情況，且為dp[i-1][j-1] + 1


    0    1    2    3    4    5    6    7   str2
0   0    0    0    0    1    1    1    1

1   0

2   1

3   1

4   1

5   1

str1

package class12;

public class Code05_PalindromeSubsequence {

	public static int lcse(char[] str1, char[] str2) {
		
		int[][] dp = new int[str1.length][str2.length];
		
		dp[0][0] = str1[0] == str2[0] ? 1 : 0;
		
		
		// 填第0列的所有值
		// 一旦st1r的i位置某個字符等於str2的0位置，那么之后都是1
		for (int i = 1; i < str1.length; i++) {
			dp[i][0] = Math.max(dp[i - 1][0], str1[i] == str2[0] ? 1 : 0);
		}
		// 填第0行的所有值
		// 一旦str2的j位置某個字符等於str1的0位置，那么之后都是1
		for (int j = 1; j < str2.length; j++) {
			dp[0][j] = Math.max(dp[0][j - 1], str1[0] == str2[j] ? 1 : 0);
		}
		
		for (int i = 1; i < str1.length; i++) {
			for (int j = 1; j < str2.length; j++) {
			
			        // dp[i - 1][j]表示可能性2
			        // dp[i][j - 1] 表示可能性3
				dp[i][j] = Math.max(dp[i - 1][j], dp[i][j - 1]);
				if (str1[i] == str2[j]) {
					dp[i][j] = Math.max(dp[i][j], dp[i - 1][j - 1] + 1);
				} 
			}
		}
		return dp[str1.length - 1][str2.length - 1];
	}

	public static void main(String[] args) {

	}

}

1.10.4 尋找業務限制的嘗試模型

四種模型中最難的一種，暫時只看process方法，process更改為動態規划的dp方法。后面會展開說明其他方法，

例題：給定一個數組，代表每個人喝完咖啡准備刷杯子的時間，只有一台咖啡機，一次只能洗一個杯子，時間耗費a，洗完才能洗下一杯。每個咖啡杯也可以自己揮發干凈，時間耗費b，咖啡杯可以並行揮發。返回讓所有咖啡杯變干凈的最早完成時間。三個參數：int[]arr , int a , int b（京東）

package class12;

import java.util.Arrays;
import java.util.Comparator;
import java.util.PriorityQueue;

// 題目
// 數組arr代表每一個咖啡機沖一杯咖啡的時間，每個咖啡機只能串行的制造咖啡。
// 現在有n個人需要喝咖啡，只能用咖啡機來制造咖啡。
// 認為每個人喝咖啡的時間非常短，沖好的時間即是喝完的時間。
// 每個人喝完之后咖啡杯可以選擇洗或者自然揮發干凈，只有一台洗咖啡杯的機器，只能串行的洗咖啡杯。
// 洗杯子的機器洗完一個杯子時間為a，任何一個杯子自然揮發干凈的時間為b。
// 四個參數：arr, n, a, b
// 假設時間點從0開始，返回所有人喝完咖啡並洗完咖啡杯的全部過程結束后，至少來到什么時間點。
public class Code06_Coffee {

	// 方法一：暴力嘗試方法
	public static int minTime1(int[] arr, int n, int a, int b) {
		int[] times = new int[arr.length];
		int[] drink = new int[n];
		return forceMake(arr, times, 0, drink, n, a, b);
	}

	// 方法一，每個人暴力嘗試用每一個咖啡機給自己做咖啡
	public static int forceMake(int[] arr, int[] times, int kth, int[] drink, int n, int a, int b) {
		if (kth == n) {
			int[] drinkSorted = Arrays.copyOf(drink, kth);
			Arrays.sort(drinkSorted);
			return forceWash(drinkSorted, a, b, 0, 0, 0);
		}
		int time = Integer.MAX_VALUE;
		for (int i = 0; i < arr.length; i++) {
			int work = arr[i];
			int pre = times[i];
			drink[kth] = pre + work;
			times[i] = pre + work;
			time = Math.min(time, forceMake(arr, times, kth + 1, drink, n, a, b));
			drink[kth] = 0;
			times[i] = pre;
		}
		return time;
	}

	// 方法一，暴力嘗試洗咖啡杯的方式
	public static int forceWash(int[] drinks, int a, int b, int index, int washLine, int time) {
		if (index == drinks.length) {
			return time;
		}
		// 選擇一：當前index號咖啡杯，選擇用洗咖啡機刷干凈
		int wash = Math.max(drinks[index], washLine) + a;
		int ans1 = forceWash(drinks, a, b, index + 1, wash, Math.max(wash, time));

		// 選擇二：當前index號咖啡杯，選擇自然揮發
		int dry = drinks[index] + b;
		int ans2 = forceWash(drinks, a, b, index + 1, washLine, Math.max(dry, time));
		return Math.min(ans1, ans2);
	}

	// 方法二：稍微好一點的解法
	public static class Machine {
		public int timePoint;
		public int workTime;

		public Machine(int t, int w) {
			timePoint = t;
			workTime = w;
		}
	}

	public static class MachineComparator implements Comparator<Machine> {

		@Override
		public int compare(Machine o1, Machine o2) {
			return (o1.timePoint + o1.workTime) - (o2.timePoint + o2.workTime);
		}

	}

	// 方法二，每個人暴力嘗試用每一個咖啡機給自己做咖啡，優化成貪心
	public static int minTime2(int[] arr, int n, int a, int b) {
		PriorityQueue<Machine> heap = new PriorityQueue<Machine>(new MachineComparator());
		for (int i = 0; i < arr.length; i++) {
			heap.add(new Machine(0, arr[i]));
		}
		int[] drinks = new int[n];
		for (int i = 0; i < n; i++) {
			Machine cur = heap.poll();
			cur.timePoint += cur.workTime;
			drinks[i] = cur.timePoint;
			heap.add(cur);
		}
		return process(drinks, a, b, 0, 0);
	}

	// 方法二，洗咖啡杯的方式和原來一樣，只是這個暴力版本減少了一個可變參數

	// process(drinks, 3, 10, 0,0)
	// a 洗一杯的時間 固定變量
	// b 自己揮發干凈的時間 固定變量
	// drinks 每一個員工喝完的時間 固定變量
	// drinks[0..index-1]都已經干凈了，不用你操心了
	// drinks[index...]都想變干凈，這是我操心的，washLine表示洗的機器何時可用
	// drinks[index...]變干凈，最少的時間點返回
	public static int process(int[] drinks, int a, int b, int index, int washLine) {
		if (index == drinks.length - 1) {
			return Math.min(Math.max(washLine, drinks[index]) + a, drinks[index] + b);
		}
		// 剩不止一杯咖啡
		// wash是我當前的咖啡杯，洗完的時間
		int wash = Math.max(washLine, drinks[index]) + a;// 洗，index一杯，結束的時間點
		// index+1...變干凈的最早時間
		int next1 = process(drinks, a, b, index + 1, wash);
		// index....
		int p1 = Math.max(wash, next1);
		int dry = drinks[index] + b; // 揮發，index一杯，結束的時間點
		int next2 = process(drinks, a, b, index + 1, washLine);
		int p2 = Math.max(dry, next2);
		return Math.min(p1, p2);
	}

	public static int dp(int[] drinks, int a, int b) {
		if (a >= b) {
			return drinks[drinks.length - 1] + b;
		}
		// a < b
		int N = drinks.length;
		int limit = 0; // 咖啡機什么時候可用
		for (int i = 0; i < N; i++) {
			limit = Math.max(limit, drinks[i]) + a;
		}
		int[][] dp = new int[N][limit + 1];
		// N-1行，所有的值
		for (int washLine = 0; washLine <= limit; washLine++) {
			dp[N - 1][washLine] = Math.min(Math.max(washLine, drinks[N - 1]) + a, drinks[N - 1] + b);
		}
		for (int index = N - 2; index >= 0; index--) {
			for (int washLine = 0; washLine <= limit; washLine++) {
				int p1 = Integer.MAX_VALUE;
				int wash = Math.max(washLine, drinks[index]) + a;
				if (wash <= limit) {
					p1 = Math.max(wash, dp[index + 1][wash]);
				}
				int p2 = Math.max(drinks[index] + b, dp[index + 1][washLine]);
				dp[index][washLine] = Math.min(p1, p2);
			}
		}
		return dp[0][0];
	}

	// 方法三：最終版本，把方法二洗咖啡杯的暴力嘗試進一步優化成動態規划
	public static int minTime3(int[] arr, int n, int a, int b) {
		PriorityQueue<Machine> heap = new PriorityQueue<Machine>(new MachineComparator());
		for (int i = 0; i < arr.length; i++) {
			heap.add(new Machine(0, arr[i]));
		}
		int[] drinks = new int[n];
		for (int i = 0; i < n; i++) {
			Machine cur = heap.poll();
			cur.timePoint += cur.workTime;
			drinks[i] = cur.timePoint;
			heap.add(cur);
		}
		if (a >= b) {
			return drinks[n - 1] + b;
		}
		int[][] dp = new int[n][drinks[n - 1] + n * a];
		for (int i = 0; i < dp[0].length; i++) {
			dp[n - 1][i] = Math.min(Math.max(i, drinks[n - 1]) + a, drinks[n - 1] + b);
		}
		for (int row = n - 2; row >= 0; row--) { // row 咖啡杯的編號
			int washLine = drinks[row] + (row + 1) * a;
			for (int col = 0; col < washLine; col++) {
				int wash = Math.max(col, drinks[row]) + a;
				dp[row][col] = Math.min(Math.max(wash, dp[row + 1][wash]), Math.max(drinks[row] + b, dp[row + 1][col]));
			}
		}
		return dp[0][0];
	}

	// for test
	public static int[] randomArray(int len, int max) {
		int[] arr = new int[len];
		for (int i = 0; i < len; i++) {
			arr[i] = (int) (Math.random() * max) + 1;
		}
		return arr;
	}

	// for test
	public static void printArray(int[] arr) {
		System.out.print("arr : ");
		for (int j = 0; j < arr.length; j++) {
			System.out.print(arr[j] + ", ");
		}
		System.out.println();
	}

	public static void main(String[] args) {
		int[] test = { 1, 1, 5, 5, 7, 10, 12, 12, 12, 12, 12, 12, 15 };
		int a1 = 3;
		int b1 = 10;
		System.out.println(process(test, a1, b1, 0, 0));
		System.out.println(dp(test, a1, b1));

		int len = 5;
		int max = 9;
		int testTime = 50000;
		for (int i = 0; i < testTime; i++) {
			int[] arr = randomArray(len, max);
			int n = (int) (Math.random() * 5) + 1;
			int a = (int) (Math.random() * 5) + 1;
			int b = (int) (Math.random() * 10) + 1;
			int ans1 = minTime1(arr, n, a, b);
			int ans2 = minTime2(arr, n, a, b);
			int ans3 = minTime3(arr, n, a, b);
			if (ans1 != ans2 || ans2 != ans3) {
				printArray(arr);
				System.out.println("n : " + n);
				System.out.println("a : " + a);
				System.out.println("b : " + b);
				System.out.println(ans1 + " , " + ans2 + " , " + ans3);
				System.out.println("===============");
				break;
			}
		}

	}

}

1.11 如何分析有沒有重復解

1、列出調用過程，可以只列出前幾層

2、有沒有重復解，一看便知

1.12 暴力遞歸到動態規划的套路

1、你已經有了一個不違反原則的暴力遞歸，而且的確存在重復調用

2、找到哪些參數的變化會影響返回值，對每一個列出變化范圍

3、參數間的所有組合數量，意味着緩存表(DP)大小

4、記憶化搜索的方法就是傻緩存，非常容易得到

5、規定好嚴格的表大小，分析位置的依賴順序，然后從基礎填寫到最終解

6、對於有枚舉行為的決策過程，進一步優化

1.13 動態規划的進一步優化

主要就是用來優化動態規划的單個位置的枚舉行為

1、空間壓縮

2、狀態化簡

3、四邊形不等式

4、其他優化技巧

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 動態規划與遞歸的性能比較 java——遞歸（動態規划，回溯）數組最大差值的最優解法（動態規划） [算法]死磕遞歸和動態規划專題算法剪繩子問題(動態規划,貪婪,遞歸) 死磕遞歸和動態規划算法動態規划訓練【算法】動態規划動態規划傳紙條(動態規划)