8.2 对角化与相似

单个特征向量已经有用；若有整组可形成基底的特征向量，情况就会彻底改变。

若一个方阵拥有足够多线性无关的特征向量，就可以找到一个坐标系，使它在该坐标系下变成对角矩阵。到那时，矩阵的幂、逆矩阵与不少结构问题都会变得几乎不需要计算。

为什么对角化重要

设一个矩阵作用于 $\mathbb{R}^n$ 。在标准基底下，这个作用可能很复杂，因为不同坐标会互相混合。若改用由特征向量组成的新基底，则矩阵对每个基向量的作用就只剩下标量乘法。

而对角矩阵正正就是这样工作的。

定义

相似

两个 $n\times n$ 矩阵 $A$ 与 $B$ 若存在可逆矩阵 $S$ 使得

S^{-1}AS=B,

便称 $A$ 与 $B$ 相似。

相似的意思，是 $A$ 与 $B$ 其实代表同一个线性变换，只不过采用了不同基底。

定义

对角化与可对角化

设 $A$ 是 $n\times n$ 矩阵。

若存在可逆矩阵 $S$ 与标量 $\lambda_1,\dots,\lambda_n$ 使得

S^{-1}AS=\operatorname{diag}(\lambda_1,\dots,\lambda_n),

则称 $A$ 可对角化，而上述等式称为 $A$ 的一个 对角化。

因此，对角化只是相似的一个特别情况：目标矩阵刚好是对角矩阵。

特征向量正是对角化矩阵的列

定理

对角化的刻画

设 $A$ 是 $n\times n$ 矩阵，并令

S=[v_1\ v_2\ \cdots\ v_n]

是一个由列向量 $v_1,\dots,v_n$ 组成的可逆矩阵。

下列叙述等价：

每个 $v_j$ 都是 $A$ 的特征向量，而对应特征值为 $\lambda_j$ ；

S^{-1}AS=\operatorname{diag}(\lambda_1,\dots,\lambda_n)

这条定理是对角化的核心。换基矩阵的列并不是随便挑的，它们必须是特征向量。

等价地，若记 $D=\operatorname{diag}(\lambda_1,\dots,\lambda_n)$ ，则

AS=SD.

这条式子的意思是：

AS 的第一列是 $Av_1$ ，而 SD 的第一列是 $\lambda_1v_1$ ；
AS 的第二列是 $Av_2$ ，而 SD 的第二列是 $\lambda_2v_2$ ；
其余各列同理。

所以单一条矩阵等式 $AS=SD$ ，其实一次性包住了所有特征向量方程。

定理

什么时候矩阵可对角化

$n\times n$ 矩阵 $A$ 可对角化，当且仅当它拥有 n 个线性无关的特征向量。

这条判准才是你应该记住的版本。对角化不是靠运气猜一个矩阵 $S$ ，而是要找出一整组能形成基底的特征向量。

第一批对角化例子

例题

一个可对角化的上三角矩阵

令

A= \begin{bmatrix} 1&1&1\\ 0&2&2\\ 0&0&3 \end{bmatrix}.

假设已知它有特征向量

u_1= \begin{bmatrix} 1\\0\\0 \end{bmatrix}, \qquad u_2= \begin{bmatrix} 1\\1\\0 \end{bmatrix}, \qquad u_3= \begin{bmatrix} 3\\4\\2 \end{bmatrix},

分别对应特征值 1、2、3。

若令

U=[u_1\ u_2\ u_3],

则三个向量线性无关，所以 $U$ 可逆。因此

U^{-1}AU=\operatorname{diag}(1,2,3).

原矩阵本身并不是对角矩阵，但在特征向量基底下，它就变成对角矩阵。

例题

一个不可对角化的矩阵

考虑

J= \begin{bmatrix} 1&4\\ 0&1 \end{bmatrix}.

它的唯一特征值是 1，因为

\det(J-\lambda I)= \begin{vmatrix} 1-\lambda&4\\ 0&1-\lambda \end{vmatrix} =(1-\lambda)^2.

现在求 $(J-I)x=0$ ：

J-I= \begin{bmatrix} 0&4\\ 0&0 \end{bmatrix}.

所以 $x_2=0$ ， $x_1$ 自由。其特征空间为

\operatorname{span}\left\{ \begin{bmatrix} 1\\0 \end{bmatrix} \right\},

只有一维。对 $2\times2$ 矩阵来说，要可对角化便必须有两个线性无关的特征向量，所以 $J$ 不可对角化。

相似矩阵会保留特征值资料

相似不是任意的共轭操作；它会保留矩阵的核心特征值结构。

定理

相似矩阵有相同特征多项式

若 $A$ 与 $B$ 相似，则

p_A(x)=p_B(x).

特别地， $A$ 与 $B$ 有相同的特征值。

这正是对角化有意义的原因。由 $A$ 得到的对角矩阵并不是另一个无关的光谱对象，而是同一个线性变换在另一组基底下的写法，只不过那组基底会把特征值直接暴露在对角线上。

常见错误

特征多项式相同，不代表一定相似

相似会推出特征多项式相同，但反过来并不成立。两个矩阵可以有相同特征多项式，却仍然不相似。

例如

\begin{bmatrix} 0&1\\ 0&0 \end{bmatrix} \qquad\text{与}\qquad \begin{bmatrix} 0&0\\ 0&0 \end{bmatrix}

都有特征多项式 $x^2$ ，但前者并不与零矩阵相似。

对角化令幂与逆矩阵变得容易

假设

A=SDS^{-1}, \qquad D=\operatorname{diag}(\lambda_1,\dots,\lambda_n).

则矩阵代数会大幅简化。

定理

可对角化矩阵的幂、逆与转置

若 $A=SDS^{-1}$ 且 $D$ 是对角矩阵，则对每个正整数 m，

A^m=SD^mS^{-1}.

若 $A$ 可逆，则 $D$ 的每个对角线项都非零，而且

A^{-1}=SD^{-1}S^{-1}.

另外， $A^T$ 也可对角化，并且与 $A$ 具有相同的特征值。

关键在于对角矩阵的幂很好算：

\operatorname{diag}(\lambda_1,\dots,\lambda_n)^m =\operatorname{diag}(\lambda_1^m,\dots,\lambda_n^m).

例题

用对角化计算矩阵幂

令

A= \begin{bmatrix} 2&1&1\\ 1&2&1\\ 1&1&2 \end{bmatrix}.

若已知

A=S\operatorname{diag}(4,1,1)S^{-1},

则

A^m=S\operatorname{diag}(4^m,1,1)S^{-1}.

因此真正困难的步骤只在于把矩阵对角化一次。之后所有正整数次方都只需把 4 改成 $4^m$ ，而重复的 1 保持不变即可。

快速检查

对角化矩阵 S 的各列必须是什么？

想想方程 $AS=SD$ 。

解答

答案

快速检查

一个 $3\times3$ 矩阵若只有两个线性无关的特征向量，可以可对角化吗？

用刻画定理回答。

解答

答案

快速检查

若 A 与 D 相似，而 D 是对角矩阵，则 A 与 D 的特征值是否相同？

利用相似定理。

解答

答案

练习

快速检查

若 A 有特征向量 $v_1,v_2,v_3$ ，对应特征值 $2,5,-1$ ，且三者线性无关，那在 A 的一个对角化中会出现哪个对角矩阵？

把对角线顺序与特征向量顺序对齐。

解答

引导解答

快速检查

解释为什么 $\begin{bmatrix}1&1\\0&1\end{bmatrix}$ 不可对角化。

检查它到底有多少个线性无关特征向量。

解答

引导解答

快速检查

若 $A=SDS^{-1}$ ，而 $D=\operatorname{diag}(2,-1)$ ，求 $A^3$ 。

用可对角化矩阵的幂公式。

解答

8.2 对角化与相似

MATH1030：线性代数 I

为什么对角化重要

相似

对角化与可对角化

特征向量正是对角化矩阵的列

对角化的刻画

什么时候矩阵可对角化

第一批对角化例子

一个可对角化的上三角矩阵

一个不可对角化的矩阵

相似矩阵会保留特征值资料

相似矩阵有相同特征多项式

特征多项式相同，不代表一定相似

对角化令幂与逆矩阵变得容易

可对角化矩阵的幂、逆与转置

用对角化计算矩阵幂

快速检查

对角化矩阵 S 的各列必须是什么？

答案

一个 $3\times3$ 矩阵若只有两个线性无关的特征向量，可以可对角化吗？

答案

若 A 与 D 相似，而 D 是对角矩阵，则 A 与 D 的特征值是否相同？

答案

练习

若 A 有特征向量 $v_1,v_2,v_3$ ，对应特征值 $2,5,-1$ ，且三者线性无关，那在 A 的一个对角化中会出现哪个对角矩阵？

引导解答

解释为什么 $\begin{bmatrix}1&1\\0&1\end{bmatrix}$ 不可对角化。

引导解答

若 $A=SDS^{-1}$ ，而 $D=\operatorname{diag}(2,-1)$ ，求 $A^3$ 。

引导解答

相关笔记

本节掌握 checkpoint

对一个 n×n 矩阵 A 来说，哪一项才是正确的可对角化判准？

先备知识

本单元重点词汇

本系列更多笔记

8.2 对角化与相似

MATH1030：线性代数 I

为什么对角化重要

相似

对角化与可对角化

特征向量正是对角化矩阵的列

对角化的刻画

什么时候矩阵可对角化

第一批对角化例子

一个可对角化的上三角矩阵

一个不可对角化的矩阵

相似矩阵会保留特征值资料

相似矩阵有相同特征多项式

特征多项式相同，不代表一定相似

对角化令幂与逆矩阵变得容易

可对角化矩阵的幂、逆与转置

用对角化计算矩阵幂

快速检查

对角化矩阵 S 的各列必须是什么？

答案

一个 3×33\times33×3 矩阵若只有两个线性无关的特征向量，可以可对角化吗？

答案

若 A 与 D 相似，而 D 是对角矩阵，则 A 与 D 的特征值是否相同？

答案

练习

若 A 有特征向量 v1,v2,v3v_1,v_2,v_3v1​,v2​,v3​，对应特征值 2,5,−12,5,-12,5,−1，且三者线性无关，那在 A 的一个对角化中会出现哪个对角矩阵？

引导解答

解释为什么 [1101]\begin{bmatrix}1&1\\0&1\end{bmatrix}[10​11​] 不可对角化。

引导解答

若 A=SDS−1A=SDS^{-1}A=SDS−1，而 D=diag⁡(2,−1)D=\operatorname{diag}(2,-1)D=diag(2,−1)，求 A3A^3A3。

引导解答

相关笔记

本节掌握 checkpoint

先备知识

本单元重点词汇

本系列更多笔记

一个 $3\times3$ 矩阵若只有两个线性无关的特征向量，可以可对角化吗？

若 A 有特征向量 $v_1,v_2,v_3$ ，对应特征值 $2,5,-1$ ，且三者线性无关，那在 A 的一个对角化中会出现哪个对角矩阵？

解释为什么 $\begin{bmatrix}1&1\\0&1\end{bmatrix}$ 不可对角化。

若 $A=SDS^{-1}$ ，而 $D=\operatorname{diag}(2,-1)$ ，求 $A^3$ 。