上三角矩陣的特征值分解


引入問題:給定一個對角線非零的上三角矩陣\(M\),求\(M^k\),滿足\(M\)的階\(\le 500\)\(k\le 10^9\)

對998244353取模。

一個顯而易見的算法是矩陣快速冪,然而是\(O(N^3\log k)\)的,無法通過本題。

一開始我想,既然是上三角矩陣,那么特征多項式一定不難求,那么是用CH定理+FFT多項式取模啥搞搞?

然而我naive了。

這題我們可以把\(M\)特征值分解為\(Q^{-1}AQ\)形式,其中\(A\)是一個對角矩陣。

那么\(M^k=(Q^{-1}AQ)^k=Q^{-1}A^kQ\)

對一個對角矩陣進行冪的復雜度是\(N\log C\)的,矩陣乘法的復雜度是\(O(N^3)\)的,對一個上三角矩陣進行特征值分解可以使用高斯消元,時間復雜度也是\(O(N^3)\),具體怎么對上三角矩陣進行特征值分解??我tm怎么知道,這個得好好研究一下

upd

自己手推沒推出來。觀察了下std,手跑了下樣例,得出來一些性質。

矩陣\(Q^{-1}\)的第\(i\)列,即為矩陣\(M\)對應第\(i\)行第\(i\)列特征值的特征向量。

這個性質通過特征值分解那套理論也不難得到--因為特征向量是\(M\)所對應“方向不變”的向量,而\(Q\)\(Q^{-1}\)就是在這些旋轉方向上的向量,通過線性變換把它們旋轉過去//線代那套理論太玄學

std里在\(Q^{-1}\)上遞推的,沒有看得非常透徹(不過大致也觀察出了一些什么),目前已經觀察得比較透徹了。

求出\(Q^{-1}\)后直接上矩陣求逆板子求\(Q\),然后直接矩陣乘法就行了。

代碼如下:

#include <cstdio>
using namespace std;

const int p = 998244353;

int n, k, a[500][500], l[500][500], r[500][500], v[500];

int qpow(int x, int y)
{
	int res = 1;
	for (x %= p; y > 0; y >>= 1, x = x * (long long)x % p)
		if (y & 1) res = res * (long long)x % p;
	return res;
}

int main()
{
	scanf("%d%d", &n, &k);
	for (int i = 0; i < n; i++)
		for (int j = 0; j < n; j++)
			scanf("%d", &a[i][j]);
	
	//求l
	for (int i = 0; i < n; i++) //枚舉l矩陣的第i列,為a矩陣對應於aii的特征向量
	{
		l[i][i] = 1; //欽定的
		for (int j = i - 1; j >= 0; j--) //求這個特征向量的第j行的值
		{
			int sum = 0; //這里需要滿足的是\sum_{k=0}^{n-1}a_{j,k}*l{k,i}=0,此時求值為$b_{ji}$
			for (int k = j + 1; k <= i; k++)
				sum = (sum + a[j][k] * (long long)l[k][i]) % p;
			l[j][i] = sum * (long long)qpow((a[i][i] - a[j][j] + p) % p, p - 2) % p;
			//注意這里是a[i][i] - a[j][j], 相當於乘了個-1,就是我們要求的值了
		}
	}
	
	//求l的逆矩陣r,注意到l是上三角矩陣
	for (int i = n - 1; i >= 0; i--)
	{
		r[i][i] = qpow(l[i][i], p - 2);
		for (int j = 0; j < i; j++)
		{
			int e = l[j][i] * (long long)qpow(l[j][j], p - 2) % p;
			for (int k = i; k < n; k++)
				r[j][k] = ((r[j][k] - r[i][k] * (long long)e % p) % p + p) % p;
		}
	}
	
	//收集答案
	for (int i = 0; i < n; i++) v[i] = qpow(a[i][i], k);
	
	long long ans1 = 0, ans2 = 0;
	
	for (int i = 0; i < n; i++)
		for (int j = i; j < n; j++)
		{
			int sb = 0;
			for (int k = i; k <= j; k++)
				sb = (sb + l[i][k] * (long long)v[k] % p * r[k][j] % p) % p;
			ans1 += sb, ans2 ^= sb;
		}
	printf("%lld %lld\n", ans1, ans2);
	return 0;
}

以后再研究下一般矩陣的特征值分解,就可以弄圖片壓縮啥的了。

這個代碼常數略大,本來可以弄小一點的

把最后收集答案時候先讓對角矩陣和l乘一下再收集、以及優化一下(x%p+p)%p那部分即可。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM