行列式会告诉你一个方阵是否可逆。特征值问的是另一个问题:哪些向量在
矩阵作用之下仍然保持原来的方向。
大部分向量经过矩阵乘法后,方向都会被改变。特征向量则是例外。它只会
被拉长、缩短,或者反向,而不会偏离本身张成的直线。这就是为什么特征
值揭示的是矩阵的内部几何,而不只是方程组能否求解。
为什么这一节重要
当你解 Ax=b 时,你关心的是整个系统。当你研究特征值时,你关心的是
那些特别的向量 v,使得矩阵作用退化成较简单的规则
Av=λv.
一旦找出这些向量,之后便能更容易处理矩阵的幂、理解对角化,并描述哪
些方向在变换下是不变的。
定义
特征值与特征向量
设 A 是一个 n×n 方阵。设 λ 是一个标量,而 v 是
Rn 中的非零列向量。
若
Av=λv,便称 v 是 A 对应于 特征值 λ 的 特征向量。
这里必须要求 v 非零。因为零向量对每个标量都满足 A0=λ0,
若把它允许进来,定义便会失去内容。
重点在于,矩阵作用与标量乘法在这个向量上完全一致。v 的方向被保
留,改变的只是长度与符号。
由定义立刻得到的结论
定理
同一个特征向量只会对应一个特征值
设 A 是方阵,而 v 是非零向量。若
Av=λv且Av=μv,则 λ=μ。
原因很直接。把两式相减:
(λ−μ)v=0.
由于 v=0,只可能是标量系数本身为 0,所以 λ=μ。
定理
特征向量的非零倍数仍是特征向量
若 v 是 A 对应于特征值 λ 的特征向量,则每个非零标量倍
cv 也是 A 的特征向量,而且对应同一个特征值 λ。
因此,特征向量从来不会只以单个向量出现;它自然代表一条穿过原点的
直线。
定理
同一特征值下的线性组合
设 u1,…,uk 都是 A 的特征向量,而且都对应同一个特征值
λ。则每个非零线性组合
α1u1+⋯+αkuk仍然是 A 对应于 λ 的特征向量。
这已经暗示:一旦把零向量加回去,对应同一个特征值的所有特征向量会形
成一个子空间。
第一批例子
例题
一个 2×2 矩阵有两个不同特征值
令
A=[13−630−14].先看向量
u1=[5−2].计算得
Au1=[13−630−14][5−2]=[5−2]=1⋅u1.所以 u1 是特征向量,而对应特征值为 1。
再看
u2=[2−1].则
Au2=[−42]=−2[2−1]=−2u2.所以 u2 对应的特征值是 −2。
例题
同一个特征值可以对应多个方向
令
B=211121112.向量
u1=111满足 Bu1=4u1,所以 4 是其中一个特征值。
再看
u2=1−10,u3=10−1.二者都满足
Bu2=u2,Bu3=u3.所以同一个特征值 1 至少已有两个线性无关的特征向量。这并不违反前
面的唯一性定理。那条定理只说:固定一个非零向量之后,它不能同时对应
两个不同特征值。它没有说:一个特征值只会有一个方向。
特征值其实是一个零空间问题
方程 Av=λv 若把所有项移到同一边,便变成
Av−λv=0.
由于 λv=λInv,这等价于
(A−λIn)v=0.
定理
用齐次系统描述特征值
设 A 是 n×n 矩阵,λ 是标量,而 v=0。
下列两件事等价:
v 是 A 对应于特征值 λ 的特征向量。
v 是齐次系统
(A−λIn)x=0的一个非平凡解。
于是,特征值问题便被改写成普通的线性系统问题。向量 v 必须落在
A−λI 的零空间内。
定义
特征空间
设 A 是 n×n 矩阵,而 λ 是 A 的一个特征值。则
A 对应于 λ 的 特征空间 定义为
EA(λ)=N(A−λIn).因此,特征空间包含所有对应于 λ 的特征向量,以及零向量。
因为它本身是一个零空间,所以 EA(λ) 自动是一个子空间。
特征值的等价刻画
一旦有了零空间版本,前面学过的可逆性词典便可以直接搬过来。
定理
判断 λ 是否为特征值的等价条件
设 A 是 n×n 矩阵,而 λ 是标量。下列叙述等价:
- λ 是 A 的特征值。
- (A−λIn)x=0 有非平凡解。
- N(A−λIn)={0}。
- A−λIn 不可逆。
- det(A−λIn)=0。
这条定理把特征值与行列式直接接起来,之后便会导向特征多项式。
例题
用行化简找特征值与特征空间
令
C=[332−2].先解
det(C−λI)=0.得到
det[3−λ32−2−λ]=(3−λ)(−2−λ)−6=λ2−λ−12.因此特征值为
λ=4,λ=−3.对 λ=4,
C−4I=[−132−6]∼[10−20].所以 x1=2x2,可取一组基为
[21].对 λ=−3,
C+3I=[6321]∼[3010].所以 3x1+x2=0,可取一组基为
[1−3].因此
EC(4)=span{[21]},EC(−3)=span{[1−3]}.
重要性质
定理
0 是否为特征值,正好等同于可逆与否
对方阵 A,下列两件事等价:
0 是 A 的特征值。
- A 不可逆。
等价地,A 可逆当且仅当 0 不是它的特征值。
这其实只是把前面的等价条件代入 λ=0。
定理
简单矩阵运算下的特征值变化
若 λ 是 A 的特征值,则:
- kλ 是
kA 的特征值;
- 对每个非负整数
m,λm 是 Am 的特征值;
- λ 也是 AT 的特征值;
- 若 A 可逆,则 λ−1 是 A−1 的特征值。
这些性质都不神秘。它们只是把相应的矩阵运算直接套在方程 Av=λv 上。
常见错误
常见错误
零向量永远不是特征向量
学生常会留意到 A0=λ0 对所有标量都成立,于是误以为零向量是所
有特征值的特征向量。正因如此,定义才必须排除零向量。特征向量代表的
是某个真正的方向,而零向量没有方向可言。
快速检查
快速检查
若 v 是 A 对应于特征值 λ 的特征向量,则 3v 也是吗?
快速检查
为什么 0 是特征值会迫使 A 不可逆?
利用系统 (A−0I)x=0 去理解。
快速检查
用零空间语言写出 EA(λ)。
练习
快速检查
证明 [11] 是 [2112] 的特征向量,并找出其特征值。
快速检查
求 A=[1004] 对应于特征值 4 的特征空间。
解 (A−4I)x=0。
快速检查
若 A 可逆,则 0 会否成为 AT 的特征值?
相关笔记
请把
7.2 行变换、乘积与可逆性
放在旁边,因为测试 det(A−λI)=0 直接依赖行列式与可逆性的理
解。
接着可读
8.2 对角化与相似,
看看一整组特征向量如何改变矩阵的整体形状。
本节的子空间观点也依赖
6.5 基底与维数。