問題描述:給定n個矩陣:A1,A2,...,An,其中Ai與Ai+1是可乘的,i=1,2...,n-1。確定計算矩陣連乘積的計算次序,使得依此次序計算矩陣連乘積需要的數乘次數最少。輸入數據為矩陣個數和每個矩陣規模,輸出結果為計算矩陣連乘積的計算次序和最少數乘次數。
問題解析:由於矩陣乘法滿足結合律,故計算矩陣的連乘積可以有許多不同的計算次序。這種計算次序可以用加括號的方式來確定。若一個矩陣連乘積的計算次序完全確定,也就是說該連乘積已完全加括號,則可以依此次序反復調用2個矩陣相乘的標准算法計算出矩陣連乘積。
完全加括號 的矩陣連乘積可遞歸地定義為:
(1)單個矩陣是完全加括號的;
(2)矩陣連乘積A是完全加括號的,則A可表示為2個完全加括號的矩陣連乘積B和C的乘積並加括號,即A=(BC)
例如,矩陣連乘積A1A2A3A4有5種不同的完全加括號的方式:(A1(A2(A3A4))),(A1((A2A3)A4)),((A1A2)(A3A4)),((A1(A2A3))A4),(((A1A2)A3)A4)。每一種完全加括號的方式對應於一個矩陣連乘積的計算次序,這決定着作乘積所需要的計算量。
看下面一個例子,計算三個矩陣連乘{A1,A2,A3};維數分別為10*100 , 100*5 , 5*50 按此順序計算需要的次數((A1*A2)*A3):10X100X5+10X5X50=7500次,按此順序計算需要的次數(A1*(A2*A3)):100*5*50 + 10*100*50 = 75000次(注意計算次數的方法 ! )
所以問題是:如何確定運算順序,可以使計算量達到最小化。
算法思路:
例:設要計算矩陣連乘乘積A1 A2 A3 A4 A5 A6,其中各矩陣的維數分別是:
A1:30*35; A2:35*15; A3:15*5; A4:5*10; A5:10*20; A6:20*25
遞推關系:
設計算A[i:j],1≤i≤j≤n,所需要的最少數乘次數m[i,j],則原問題的最優值為m[1,n]。
當i=j時,A[i:j]=Ai,因此,m[i][i]=0,i=1,2,…,n
當i<j時,若A[i:j]的最優次序在Ak和Ak+1之間斷開,i<=k<j,則:m[i][j]=m[i][k]+m[k+1][j]+pi-1pkpj。由於在計算是並不知道斷開點k的位置,所以k還未定。不過k的位置只有j-i個可能。因此,k是這j-i個位置使計算量達到最小的那個位置。
綜上,有遞推關系如下:
若將對應m[i][j]的斷開位置k記為s[i][j],在計算出最優值m[i][j]后,可遞歸地由s[i][j]構造出相應的最優解。s[i][j]中的數表明,計算矩陣鏈A[i:j]的最佳方式應在矩陣Ak和Ak+1之間斷開,即最優的加括號方式應為(A[i:k])(A[k+1:j)。
因此,從s[1][n]記錄的信息可知計算A[1:n]的最優加括號方式為(A[1:s[1][n]]) (A[ s[1][n]+1 : n] ),進一步遞推,A[1:s[1][n]]的最優加括號方式為(A[1:s[1][s[1][n]]])(A[s[1][s[1][n]]+1:s[1][s[1][n]]])。同理可以確定A[ s[1][n]+1 :n]的最優加括號方式在s[ s[1][n]+1 ][n]處斷開...照此遞推下去,最終可以確定A[1:n]的最優完全加括號方式,及構造出問題的一個最優解:
如下例題:
備忘錄遞歸算法
備忘錄方法用表格保存已解決的子問題答案,在下次需要解決此子問題時,只要簡單查看該子問題的解答,而不必重新計算。備忘錄方法為每一個子問題建立一個記錄項,初始化時,該記錄項存入一個特殊的值,表示該子問題尚未求解。在求解的過程中,對每個帶求的子問題,首先查看其相應的記錄項。若記錄項中存儲的是初始化時存入的特殊值,則表示該問題是第一次遇到,此時計算出該子問題的解,並將其保存在相應的記錄項中,以備以后查看。若記錄項中存儲的已不是初始化時存入的特殊值,則表示該子問題已被計算過,相應的記錄項中存儲的是該子問題的解答。此時從記錄項中取出該子問題的解答即可,而不必重新計算。
//A1 30*35 A2 35*15 A3 15*5 A4 5*10 A5 10*20 A6 20*25
//p[0-6]={30,35,15,5,10,20,25}
#include<iostream>
using namespace std;
#define N 7 //N為7,實際表示有6個矩陣
int p[N]={30,35,15,5,10,20,25};
int m[N][N],s[N][N];
int LookupChain(int i, int j){
if(m[i][j]>0)
return m[i][j];
if(i == j)
return 0;
m[i][j] = LookupChain(i,i) + LookupChain(i+1,j)+p[i-1]*p[i]*p[j];
s[i][j] = i;
for(int k=i+1; k<j;k++){
int t = LookupChain(i,k)+LookupChain(k+1,j)+p[i-1]*p[k]*p[j];
if(t<m[i][j]){
m[i][j]=t;
s[i][j]=k;
}
}
return m[i][j];
}
int MemorizedMatrixChain(int n, int m[][N], int s[][N]){
for(int i=1;i<=n;i++){ //初始化默認都是0
for(int j=1;j<=n;j++)
m[i][j] = 0;
}
return LookupChain(1,n);
}
/*
*追蹤函數:根據輸入的i,j限定需要獲取的矩陣鏈的始末位置,s存儲斷鏈點
*/
void Traceback(int i,int j, int s[][N]){
if(i==j) //回歸條件
{
cout<<"A"<<i;
}
else //按照最佳斷點一分為二,接着繼續遞歸
{
cout<<"(";
Traceback(i,s[i][j],s);
Traceback(s[i][j]+1,j,s);
cout<<")";
}
}
int main(){
MemorizedMatrixChain(N-1,m,s);//N-1因為只有六個矩陣
Traceback(1,6,s);
return 0;
}
參考: https://blog.csdn.net/qq648483997/article/details/93063764
https://blog.csdn.net/liufeng_king/article/details/8497607
https://www.cnblogs.com/lixing-nlp/p/7688989.html 老師的課件內容