問題描述:
給定n個矩陣:A1,A2,...,An,其中Ai與Ai+1是可乘的,i=1,2...,n-1。確定計算矩陣連乘積的計算次序,使得依此次序計算矩陣連乘積需要的數乘次數最少。輸入數據為矩陣個數和每個矩陣規模,輸出結果為計算矩陣連乘積的計算次序和最少數乘次數。
問題解析:
由於矩陣乘法滿足結合律,故計算矩陣的連乘積可以有許多不同的計算次序。這種計算次序可以用加括號的方式來確定。若一個矩陣連乘積的計算次序完全確定,也就是說該連乘積已完全加括號,則可以依此次序反復調用2個矩陣相乘的標准算法計算出矩陣連乘積。
完全加括號的矩陣連乘積可遞歸地定義為:
(1)單個矩陣是完全加括號的;
(2)矩陣連乘積A是完全加括號的,則A可表示為2個完全加括號的矩陣連乘積B和C的乘積並加括號,即A=(BC)
例如,矩陣連乘積A1A2A3A4有5種不同的完全加括號的方式:(A1(A2(A3A4))),(A1((A2A3)A4)),((A1A2)(A3A4)),((A1(A2A3))A4),(((A1A2)A3)A4)。每一種完全加括號的方式對應於一個矩陣連乘積的計算次序,這決定着作乘積所需要的計算量。
看下面一個例子,計算三個矩陣連乘{A1,A2,A3};維數分別為10*100 , 100*5 , 5*50 按此順序計算需要的次((A1*A2*A3):10X100X5+10X5X50=7500次,按此順序計算需要的次數(A1*(A2*A3)):10*5*50+10*100*50=75000次
所以問題是:如何確定運算順序,可以使計算量達到最小化。
算法思路:
例:設要計算矩陣連乘乘積A1A2A3A4A5A6,其中各矩陣的維數分別是:
A1:30*35; A2:35*15; A3:15*5; A4:5*10; A5:10*20; A6:20*25
遞推關系:
設計算A[i:j],1≤i≤j≤n,所需要的最少數乘次數m[i,j],則原問題的最優值為m[1,n]。
當i=j時,A[i:j]=Ai,因此,m[i][i]=0,i=1,2,…,n
當i<j時,若A[i:j]的最優次序在Ak和Ak+1之間斷開,i<=k<j,則:m[i][j]=m[i][k]+m[k+1][j]+pi-1*pk*pj。由於在計算是並不知道斷開點k的位置,所以k還未定。不過k的位置只有j-i個可能。因此,k是這j-i個位置使計算量達到最小的那個位置。
綜上,有遞推關系如下:
計算最優值:
用動態規划算法解此問題時,可依據其遞歸式以自底向上的方式進行計算。在計算過程中,保存以解決的子問題的答案,每個子問題只計算一次,而在后面用到時只需要簡單查一下,避免了大量的重復計算,最后得到了多項式時間的算法。
代碼如下:
1 void matrixChain(int p[],int m[][],int s[][]) 2 //p用來記錄矩陣,m[i][j]表示第i個矩陣到第j個矩陣的最優解,s[][]記錄從哪里斷開可以得到最優解 3 { 4 int n=len-1; 5 for(int i=1; i<=n; i++)//初始化數組 6 m[i][j]=0; 7 for(int r=2; r<=n; r++)//對角線循環 8 { 9 for(int i=1; i<=n-r+1; i++) //行循環 10 { 11 int j=i+r-1;//列的控制 12 m[i][j]=m[i+1][j]+p[i-1]*p[i]*p[j];//找m[i][j]的最小值,初始化使k=i; 13 s[i][j]=i; 14 for(int k=i+1; k<j; k++) 15 { 16 int t=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j]; 17 if(t<m[i][j]) 18 { 19 s[i][j]=k;//在k位置斷開得到最優解 20 m[i][j]=t; 21 } 22 } 23 } 24 } 25 }
構造最優解:
若將對應m[i][j]的斷開位置k記為s[i][j],在計算出最優值m[i][j]后,可遞歸地由s[i][j]構造出相應的最優解。s[i][j]中的數表明,計算矩陣鏈A[i:j]的最佳方式應在矩陣Ak和Ak+1之間斷開,即最優的加括號方式應為(A[i:k])(A[k+1:j)。因此,從s[1][n]記錄的信息可知計算A[1:n]的最優加括號方式為(A[1:s[1][n]])(A[s[1][n]+1:n]),進一步遞推,A[1:s[1][n]]的最優加括號方式為(A[1:s[1][s[1][n]]])(A[s[1][s[1][n]]+1:s[1][s[1][n]]])。同理可以確定A[s[1][n]+1:n]的最優加括號方式在s[s[1][n]+1][n]處斷開...照此遞推下去,最終可以確定A[1:n]的最優完全加括號方式,及構造出問題的一個最優解。
代碼如下:
1 void traceback(int s[][],int i,int j) 2 { 3 if(i==j) 4 retiurn; 5 traceback(s,i,s[i][j]); 6 traceback(s,s[i][j]+1,j); 7 cout<<"Multiply A"<<i<<","<<s[i][j]<<"and A"<<s[i][j]+1<<","<<j<<endl; 8 }
完整代碼如下:
1 #include<stdio.h> 2 #include<iostream> 3 #include<algorithm> 4 #include<stdlib.h> 5 using namespace std; 6 const int MAX = 100; 7 int n; 8 int p[MAX+1],m[MAX][MAX],s[MAX][MAX]; 9 //p用來記錄矩陣,m[i][j]表示第i個矩陣到第j個矩陣的最優解,s[][]記錄從哪里斷開可以得到最優解 10 void matrixChain() 11 { 12 for(int i=1; i<=n; i++)//初始化數組 13 m[i][i]=0; 14 for(int r=2; r<=n; r++)//對角線循環 15 { 16 for(int i=1; i<=n-r+1; i++) //行循環 17 { 18 int j=i+r-1;//列的控制 19 m[i][j]=m[i+1][j]+p[i-1]*p[i]*p[j];//找m[i][j]的最小值,初始化使k=i; 20 s[i][j]=i; 21 for(int k=i+1; k<j; k++) 22 { 23 int t=m[i][k]+m[k+1][j]+p[i-1]*p[k]*p[j]; 24 if(t<m[i][j]) 25 { 26 s[i][j]=k;//在k位置斷開得到最優解 27 m[i][j]=t; 28 } 29 } 30 } 31 } 32 } 33 void traceback(int i,int j) 34 { 35 if(i==j) 36 return; 37 traceback(i,s[i][j]); 38 traceback(s[i][j]+1,j); 39 cout<<"Multiply A"<<i<<","<<s[i][j]<<"and A"<<s[i][j]+1<<","<<j<<endl; 40 } 41 int main() 42 { 43 cin>>n; 44 for(int i=0; i<=n; i++) 45 cin>>p[i]; 46 matrixChain(); 47 traceback(1,n); 48 cout<<m[1][n]<<endl; 49 return 0; 50 }
輸出結果如下: