先给一个简短的回答,如果把矩阵看作是向量的运动,对于运动而言,最重要的当然就是运动的速度和方向,那么:
1)特征值就是运动的速度
2)特征向量就是运动的方向
既然运动最重要的两方面都被描述了,特征值、特征向量自然可以称为运动(即矩阵)的特征。
注意:由于矩阵是数学概念,非常抽象,所以上面所谓的运动、运动的速度、运动的方向都是广义的,在现实不同的应用中有不同的指代。
特征值和特征向量研究的是线性变换,首先确定一个线性空间,然后在该空间中选择一组基作为参考系,由于线性变换是向量到自身空间的
映射,所以它是一个方阵。
定义:设 $A$ 是 $n$ 阶方阵,若存在数 $\lambda$ 和非零向量 $\alpha$ 满足
$$A\alpha = \lambda \alpha,\alpha \neq 0$$
则称 $\lambda$ 是 $A$ 的一个特征值,$\alpha$ 为 $A$ 对应于特征值 $\lambda$ 的特征向量。
通俗来讲:向量 $\alpha$ 在 $A$ 的作用下,保持方向不变,进行比例为 $\lambda$ 的伸缩。
从特征向量和特征值的定义式还可以看出,特征向量所在直线上的向量都是特征向量。
一个特征值对应的线性无关的特征向量,它们可以构成一个线性空间,称为特征空间,特征空间中的任一个元素都是特征向量,同一个特征
值可能对应多个线性无关的特征向量,这些特征向量就可以构成特征空间的一组基,它们的线性组合当然还是特征空间中的元素,也就还是该
特征值对应的特征向量,这一点很容易通过定义来证明。
当一个矩阵作用于一个向量时,会有不同的效果,比如方向、长度的变化,当这个向量是这个矩阵的特征向量时,相对于原向量的长度变
化最明显,假如在一堆向量中包含特征向量,但是不知道哪个是,这时可以用该矩阵反复作用于各个向量,多次作用之后,特征向量会明
显区别于其它向量,特征向量对应的特征值越大,则向量长度增长越快,特征值小于 $1$,向量长度就不断缩小。
那怎么求一个矩阵的特征值和特征向量呢?
已知
$$A\alpha = \lambda \alpha$$
所以得到方程
$$(A-\lambda E) \cdot \alpha = 0$$
其中 $\lambda$ 和 $\alpha$ 都是未知的。我们知道,一个特征值对应的特征向量不唯一,任意一个特征向量的倍乘都是特征向量,
所以对于任一个特征值 $\lambda$,方程必须有无穷解,即
$$r(A-\lambda E) < n$$
又因为矩阵 $A$ 是方阵,所以有行列式
$$|A-\lambda E| = 0$$
从中可以解出全部的特征值,然后将特征值一一代入方程,解出对应的特征向量。