一 定义
假设矩阵A为n*n方阵,x为n*1向量,则y=Ax表示矩阵A对向量x的线性变换结果,由于A为n*n方阵,则y为n*1向量。对大多数x进行线性变换,得到向量y与原向量x一般都不共线,只有少数向量x满足
,其中
被称为矩阵A的特征值,x 被称为矩阵A的特征向量。
为了求解特征值
与特征向量 x, 对上式改写为
,则特征向量在
零空间中,通过选取一定特征值使得矩阵
为奇异矩阵,即
。根据矩阵行列式计算公式,得到关于
的n次方程,然后根据计算出的特征值,通过寻找矩阵
的零空间计算特征向量。
在求解特征值时,有两个定理可以简化计算:
1)
,矩阵A的特征值之和等于矩阵A的迹;
2)
,矩阵A的特征值之积等于矩阵A的行列式值;
以 2 * 2 矩阵为例,给出以上结论的大致解释:
,
,
,
由于
,上式改写为
,
解得
,
,
故
,
。
在求解
时,可能出现特征值
重复情况,这可能导致特征向量 x 不足,这样后面的分析也无法继续。特征值重复并不一定导致特征向量不足,如单位矩阵I,虽然其特征值都为1,但有n个不同的特征向量。
针对各个元素均为实数2*2情况,其特征值可能出现负数,如矩阵
特征值为 i 和 -i。通过观察,如果矩阵A为对称矩阵,其特征值为实数;如果矩阵A为反对称矩阵,其特征值为一对共轭虚数。
也就是说矩阵越接近对称矩阵,其特征值越有可能为实数。
二 矩阵对角化
假设矩阵A为n*n方阵,矩阵A有n个线性独立的特征向量
,构成特征向量矩阵
,其对应的特征值为
,构成特征值矩阵
,则矩阵A可被对角化分解,其公式为:
,推导如下:
,
。
如果已知
,则有
,这表明矩阵
的特征值为矩阵A的对应特征值的平方,矩阵
与矩阵A有相同的特征向量。以上推导也可以通过矩阵对角化公式得到:
。
针对A的任意整数次幂,可对角化为:
,这就提供了一个计算
的方法。
如果矩阵A可逆,则有:
,其逆矩阵与原矩阵有相同的特征向量和互为倒数的特征值。
三 应用(差分方程与微分方程)
1 复利
假设银行年利率为 .06,投资 1000 元后 5 年的收益为多少?
建立差分方程
,为了与后面的微分方程相比较,可将其改写为
,
,
;
如果按月计算复利,则有
;
如果按天计算复利,则有
;
如果按无限小时间计算复利,则有
,
由于
,
;
可将差分方程
改写为无限小距离间的差分为
,
,
;
以上
,
分别为复利的差分与微分方程。
2 Fibonacci序列
Fibonacci定义为:
,该表达式为二阶差分,可通过一些技巧变换为一阶差分:
,
。
已知
,可推导出
。如果矩阵A可对角化,对
可做如下变换:
,将
详细代入,则有
,令
,则
,表明
由特征向量S按系数向量c线性组合得到。
最终可被表示为:
。
通过以上推导,如果仅需要计算某个特定的
值,仅需使用公式
即可。使用
线性组合关系,可以通过特征值取值范围判断k趋近无穷大时其收敛状态;当所有特征值均满足
,
趋近稳定状态,可表示为:
(假设
)或者
(假设所有特征值绝对值都小于1)。
针对矩阵
,计算特征值为
,
,特征向量为
,
。根据以上分析,当k逐渐变大时,有:
。
3 Markov矩阵
Markov矩阵定义如下:
1)矩阵所有元素均满足
;
2)矩阵每列元素和等于1;
Markov矩阵具有如下性质:
1)
为Markov矩阵的一个特征值;
2)
对应的特征向量
各个元素都为非负值;
3)其他特征值满足
;
4)Markov矩阵的幂级数稳定状态为:
。
给出一个具体的Markov矩阵
,假设
是该矩阵的一个特征值,则有
,观察矩阵
为奇异矩阵,
处于矩阵
的零空间,则证明
为Markov矩阵的一个特征值。
4 微分方程
标量常微分方程:
,求解如下:
,
,
,
;
已知 u(0),
。
对于矢量常微分方程
,已知 u(0),其解为
,其中 A 为 n * n 矩阵,u(t),u(0) 为 n * 1 向量;
这里需要关注
的含义:
对于实数 a, 有
,
对于矩阵 A,有
,
带入
得
,
,以 2 * 2 矩阵为例,
可分解为:
,将各个矩阵相加得:
,
将 u(0) 分解为特征向量得线性组合
,
,
,
以上推导出常微分方程的解,其解为每个特征向量的线性组合,与差分方程解
类似。
矢量常微分方程:
,矩阵A特征值与特征向量为:
;
类比标量常微分方程,其解表达为:
,将解整理:
,
,
,
,
。
观察以上微分方程解,当所有特征值均满足
,u(t)收敛;当
,u(t)发散。
参考资料:Linear Algebra And Its Applicaions Gilbert Strang
