单个特征向量已经有用;若有整组可形成基底的特征向量,情况就会彻底改
变。
若一个方阵拥有足够多线性无关的特征向量,就可以找到一个坐标系,使它
在该坐标系下变成对角矩阵。到那时,矩阵的幂、逆矩阵与不少结构问题都
会变得几乎不需要计算。
为什么对角化重要
设一个矩阵作用于 Rn。在标准基底下,这个作用可能很复
杂,因为不同坐标会互相混合。若改用由特征向量组成的新基底,则矩阵对
每个基向量的作用就只剩下标量乘法。
而对角矩阵正正就是这样工作的。
定义
相似
两个 n×n 矩阵 A 与 B 若存在可逆矩阵 S 使得
S−1AS=B,便称 A 与 B 相似。
相似的意思,是 A 与 B 其实代表同一个线性变换,只不过采用了不
同基底。
定义
对角化与可对角化
设 A 是 n×n 矩阵。
若存在可逆矩阵 S 与标量 λ1,…,λn 使得
S−1AS=diag(λ1,…,λn),则称 A 可对角化,而上述等式称为 A 的一个 对角化。
因此,对角化只是相似的一个特别情况:目标矩阵刚好是对角矩阵。
特征向量正是对角化矩阵的列
定理
对角化的刻画
设 A 是 n×n 矩阵,并令
S=[v1 v2 ⋯ vn]是一个由列向量 v1,…,vn 组成的可逆矩阵。
下列叙述等价:
- 每个 vj 都是 A 的特征向量,而对应特征值为 λj;
S−1AS=diag(λ1,…,λn)
这条定理是对角化的核心。换基矩阵的列并不是随便挑的,它们必须是特征
向量。
等价地,若记 D=diag(λ1,…,λn),
则
AS=SD.
这条式子的意思是:
AS 的第一列是 Av1,而 SD 的第一列是 λ1v1;
AS 的第二列是 Av2,而 SD 的第二列是 λ2v2;
- 其余各列同理。
所以单一条矩阵等式 AS=SD,其实一次性包住了所有特征向量方程。
定理
什么时候矩阵可对角化
n×n 矩阵 A 可对角化,当且仅当它拥有 n 个线性无关的特征
向量。
这条判准才是你应该记住的版本。对角化不是靠运气猜一个矩阵 S,而
是要找出一整组能形成基底的特征向量。
第一批对角化例子
例题
一个可对角化的上三角矩阵
令
A=100120123.假设已知它有特征向量
u1=100,u2=110,u3=342,分别对应特征值 1、2、3。
若令
U=[u1 u2 u3],则三个向量线性无关,所以 U 可逆。因此
U−1AU=diag(1,2,3).原矩阵本身并不是对角矩阵,但在特征向量基底下,它就变成对角矩阵。
例题
一个不可对角化的矩阵
考虑
J=[1041].它的唯一特征值是 1,因为
det(J−λI)=1−λ041−λ=(1−λ)2.现在求 (J−I)x=0:
J−I=[0040].所以 x2=0,x1 自由。其特征空间为
span{[10]},只有一维。对 2×2 矩阵来说,要可对角化便必须有两个线性无关的
特征向量,所以 J 不可对角化。
相似矩阵会保留特征值资料
相似不是任意的共轭操作;它会保留矩阵的核心特征值结构。
定理
相似矩阵有相同特征多项式
若 A 与 B 相似,则
pA(x)=pB(x).特别地,A 与 B 有相同的特征值。
这正是对角化有意义的原因。由 A 得到的对角矩阵并不是另一个无关的
光谱对象,而是同一个线性变换在另一组基底下的写法,只不过那组基底会
把特征值直接暴露在对角线上。
常见错误
特征多项式相同,不代表一定相似
相似会推出特征多项式相同,但反过来并不成立。两个矩阵可以有相同特征
多项式,却仍然不相似。
例如
[0010]与[0000]都有特征多项式 x2,但前者并不与零矩阵相似。
对角化令幂与逆矩阵变得容易
假设
A=SDS−1,D=diag(λ1,…,λn).
则矩阵代数会大幅简化。
定理
可对角化矩阵的幂、逆与转置
若 A=SDS−1 且 D 是对角矩阵,则对每个正整数 m,
Am=SDmS−1.若 A 可逆,则 D 的每个对角线项都非零,而且
A−1=SD−1S−1.另外,AT 也可对角化,并且与 A 具有相同的特征值。
关键在于对角矩阵的幂很好算:
diag(λ1,…,λn)m=diag(λ1m,…,λnm).
例题
用对角化计算矩阵幂
令
A=211121112.若已知
A=Sdiag(4,1,1)S−1,则
Am=Sdiag(4m,1,1)S−1.因此真正困难的步骤只在于把矩阵对角化一次。之后所有正整数次方都只需
把 4 改成 4m,而重复的 1 保持不变即可。
快速检查
快速检查
一个 3×3 矩阵若只有两个线性无关的特征向量,可以可对角化吗?
快速检查
若 A 与 D 相似,而 D 是对角矩阵,则 A 与 D 的特征值是否相同?
练习
快速检查
若 A 有特征向量 v1,v2,v3,对应特征值 2,5,−1,且三者线性无关,那在 A 的一个对角化中会出现哪个对角矩阵?
快速检查
解释为什么 [1011] 不可对角化。
快速检查
若 A=SDS−1,而 D=diag(2,−1),求 A3。
相关笔记
若你对特征值与零空间的关系仍未稳固,应先回看
8.1 特征值、特征向量与特征空间。
接着可读
8.3 特征多项式与对角化测试,
因为那一节会提供判断“是否有足够特征向量”的多项式工具。
本节使用的基底语言也依赖
6.5 基底与维数。