5.1 可逆矩阵

可逆性是线性代数中最早让你感受到“一个矩阵表示一个可逆过程”的地方。对于方阵，如果它可逆，就表示有另一个方阵能够把它完全还原。更重要的是，这个概念和许多其他说法其实等价：可以行化简成单位矩阵、每个方程组 $Ax = b$ 都有解、列向量线性无关，以及矩阵乘法可以被系统地反向处理。

这一页会把这些等价关系分开讲清楚。目标不只是会写 $A^{-1}$ ，而是能严格判断一个方阵什么时候可逆，以及怎样可靠地算出它的逆矩阵。

左逆和右逆

先不要直接进入方阵。对一般矩阵，左逆和右逆是两个不同概念。

定义

左逆与右逆

设 $A$ 是一个 $p \times q$ 矩阵。

如果一个 $q \times p$ 矩阵 $H$ 满足 $HA = I_q$ ，那么 $H$ 是 $A$ 的左逆。
如果一个 $q \times p$ 矩阵 $G$ 满足 $AG = I_p$ ，那么 $G$ 是 $A$ 的右逆。

这两个定义很重要，因为矩阵乘法不交换。对于长方形矩阵，左逆和右逆不一定同时存在；即使都存在，也不一定相同。方阵的情况更特殊。

定义

可逆矩阵

如果 $A$ 是一个 $p \times p$ 方阵，并且存在另一个 $p \times p$ 矩阵 $B$ 使得

BA = AB = I_p,

那么 $A$ 称为可逆。矩阵 $B$ 称为 $A$ 的逆矩阵，记作 $A^{-1}$ 。

定理

逆矩阵是唯一的

如果 $B$ 是 $A$ 的左逆，而 $C$ 是 $A$ 的右逆，那么 $B = C$ 。所以可逆矩阵只有一个逆矩阵。

证明

为什么逆矩阵唯一

什么叫可逆

可逆本质上就是“可以完全反过来”。 $A$ 做一次变换之后，如果 $A^{-1}$ 存在，就能把结果准确地拉回原位。

单位矩阵 $I_p$ 之所以出现，是因为它不会改变任何向量：

I_p x = x

对任何相容向量 x 都成立。逆矩阵就是让你回到这个“不被改变”的状态的矩阵。

例题

对角矩阵最容易看出逆矩阵

设

D = \operatorname{diag}(2, -1, 3).

那么

D^{-1} = \operatorname{diag}\left(\tfrac{1}{2}, -1, \tfrac{1}{3}\right).

原因很直接：对角线上的非零元素变成倒数，其余位置的零保持不变。把 $D$ 和 $D^{-1}$ 相乘，就会得到 $I_3$ 。

行化简和逆矩阵

实际计算逆矩阵时，最可靠的方法是行化简。课程材料的核心想法分成两步：

行变换矩阵本身可逆，而且它的逆就是反向行变换矩阵；
一个方阵可逆，当且仅当它能够被行化简到 $I_p$ 。

定理

行变换矩阵是可逆的

如果 $\rho$ 是一个对 p 行矩阵进行的行变换，而 $\bar{\rho}$ 是对应的反向行变换，那么行变换矩阵 $M[\rho]$ 和 $M[\bar{\rho}]$ 满足

M[\rho]^{-1} = M[\bar{\rho}], \qquad M[\bar{\rho}]^{-1} = M[\rho].

所以每一步行化简，其实都是在左乘一个可逆矩阵。这个观点会让后面的很多证明更清楚。

定理

可逆性和行化简

对一个方阵 $A$ ，以下命题等价：

$A$ 可逆；
$A$ 与 $I_p$ 行等价；
$A$ 是若干个行变换矩阵的乘积；
$A$ 是非奇异矩阵。

所以当你把 $A$ 和 $I_p$ 并排写成 $[A | I_p]$ ，再做行化简时，如果左边最后变成 $I_p$ ，右边就会读出 $A^{-1}$ 。

边读边试

跟着看一个用行化简求逆的例子

互动示范让你逐步把 [A | I] 化简，直到左边变成 I。

由 [A | I] 开始。若 A 可逆，行化简会把左边化成 I。

1	2	1	1	0	0
0	1	1	0	1	0
2	3	4	0	0	1

上面的交互示范直接展示“把 [A | I] 化到左边变成 $I$ ”到底是什么意思。它不是定义本身，而是和定义完全一致的计算方法。

边读边试

跟着走完一条行化简路径

互动步骤器会带你走完一条完整的消元路径，逐步显示行变换、正在处理的主元，以及每一步得到的矩阵。

1	2	2	4
1	3	3	5
2	6	5	6

行变换

先在第 1 列选主元。

要留意什么

第 1 列的第一行已经有方便的主元 1，所以暂时不用换行。

先由增广矩阵开始。第一个主元的工作，是帮我们把它下面的元素清掉。

第二个交互工具显示一条完整的消元路径。对于可逆矩阵，重点不是“做了多少步”，而是“左边最后真的化成了 $I_p$ ”。

等价表述

可逆性有一个非常重要的“字典”：它可以用很多不同语言来描述。

定理

识别可逆矩阵的等价条件

设 $A$ 是一个 $p \times p$ 矩阵。以下命题等价：

$A$ 可逆。
$A$ 与 $I_p$ 行等价。
$A$ 是若干个行变换矩阵的乘积。
$A$ 有左逆。
$A$ 有右逆。
$A$ 是非奇异矩阵。
对每个 p 维列向量 b，方程组 $Ax = b$ 都相容。
对每个 p 维列向量 b，方程组 $Ax = b$ 都有唯一解，且解为 $x = A^{-1}b$ 。

其中两个最实用：

第 7 点说明： $A$ 的列向量张成 $R^p$ 。
第 8 点说明：一旦可逆，就不只是“有解”，而是可以直接写出解。

所以可逆性正是矩阵解方程组时最核心的代数条件。

从可逆矩阵角度理解行等价

现在把行变换观点再向前推进一步：不只把行等价理解成一连串行变换，而是把整个过程打包成左边乘上一个可逆矩阵。

定理

行等价等同于左乘一个可逆矩阵

设 $A$ 和 $B$ 是有 p 行的矩阵。以下命题等价：

$A$ 和 $B$ 行等价；
存在一个可逆的 $p \times p$ 矩阵 $G$ ，使得

B = GA.

并且一旦 $B = GA$ ，就同时有

A = G^{-1}B.

这个定理不是另一种计算技巧，而是对同一现象更干净的表达。任何有限步行变换都可以压缩成左边一个可逆矩阵 $G$ ；反向行变换则由 $G^{-1}$ 编码。

例题

把行等价读成一条矩阵等式

设

A = \begin{bmatrix} 1 & 0 & 1 \\ 1 & 2 & 3 \\ 0 & 1 & 1 \end{bmatrix}, \qquad G = \begin{bmatrix} 1 & 0 & 0 \\ -1 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix}.

矩阵 $G$ 正是行变换

R_2 \leftarrow R_2 - R_1

对应的行变换矩阵。所以

GA = \begin{bmatrix} 1 & 0 & 1 \\ 0 & 2 & 2 \\ 0 & 1 & 1 \end{bmatrix}.

如果把这个新矩阵记作 $B$ ，那么就有 $B = GA$ 。这一条等式已经完整记录了这次行变换。因为 $G$ 可逆，所以 $A$ 和 $B$ 行等价。

它的理论价值很高。只要知道行等价就是左乘一个可逆矩阵，后面很多“什么量被保留”的结论都可以一行说明。

定理

行变换保留对应列向量之间的线性关系

设 $A$ 和 $B$ 是行等价的 $p \times q$ 矩阵，并把它们的列写成

A = [a_1 \; a_2 \; \cdots \; a_q], \qquad B = [b_1 \; b_2 \; \cdots \; b_q].

如果

a_j = \alpha_1 a_{k_1} + \alpha_2 a_{k_2} + \cdots + \alpha_n a_{k_n},

那么必然有

b_j = \alpha_1 b_{k_1} + \alpha_2 b_{k_2} + \cdots + \alpha_n b_{k_n}.

特别地，对应列之间的线性相关和线性无关，都会被行等价保留。

一旦知道 $B = GA$ ，证明就很短。把 $A$ 的列关系左乘 $G$ ，由矩阵乘法的线性性质可得

Ga_j = \alpha_1 G a_{k_1} + \alpha_2 G a_{k_2} + \cdots + \alpha_n G a_{k_n},

这正是 $B$ 的对应列满足同一组系数关系。

这个结果就是从行化简走向列语言的桥梁。行变换会改变列向量本身，但不会改变哪些列是多余的，也不会改变某一列如何由其他列线性表示。

为什么 RREF 是唯一的

在每个行等价类里，最简行阶梯形其实只有一个。这一点很容易被忽略，但它正是后面定义能够成立的基础。

定理

每个行等价类只有一个最简行阶梯形

设 $A$ 是一个矩阵， $B$ 和 $C$ 都是 reduced row-echelon form。若 $B$ 与 $A$ 行等价，而 $C$ 也与 $A$ 行等价，那么

B = C.

标准证明会对秩做数学归纳。核心策略是：

从左到右比较主元列；
用“线性关系被保留”来迫出相同的主元位置；
再证明每一个自由列都必须以同样的系数由前面的主元列组合而成。

所以 RREF 不只是“某个方便的最后形状”，而是该行等价类中唯一的最后形状。

定义

秩

一个矩阵的秩，就是它的 reduced row-echelon form 中主元的数目。

这个定义之所以成立，正因为 RREF 是唯一的。如果不同消元路径会得到不同 RREF，那么主元数目就会跟算法一起改变，rank 便不会是良定的。

列向量的无关与线性组合

可逆性也可以用列向量语言来读。

定理

可逆性和列向量

对一个 $p \times p$ 矩阵 $A$ ，以下命题等价：

$A$ 可逆；
$A$ 的列向量线性无关；
$R^p$ 中每个向量都可以写成 $A$ 的列向量的线性组合。

这三句话其实是同一件事的三种说法。

如果列向量线性无关，就表示没有一列是多余的。如果列向量张成 $R^p$ ，就表示每个目标向量都能构造出来。对方阵来说，这两个条件同时成立，正是可逆。

转置和幂次

可逆性和转置也相容。

定理

转置与幂次

如果 $A$ 可逆，那么：

$A^t$ 也可逆，而且 $(A^t)^{-1} = (A^{-1})^t$ ；
$A^n$ 对每个整数 n 都可逆，而且 $(A^n)^{-1} = (A^{-1})^n$ 。

转置结果方便你把关于列的命题改写成关于行的命题；幂次结果则适合处理重复出现的变换。

例题

用行化简求逆矩阵

设

A = \begin{bmatrix} 1 & 2 \\ 3 & 5 \end{bmatrix}.

先写出 $[A | I_2]$ ：

\left[\begin{array}{cc|cc} 1 & 2 & 1 & 0 \\ 3 & 5 & 0 & 1 \end{array}\right].

先消去左下角的 3：

\left[\begin{array}{cc|cc} 1 & 2 & 1 & 0 \\ 0 & -1 & -3 & 1 \end{array}\right].

再把第二行除以 $-1$ ，然后清掉第一行第二列：

\left[\begin{array}{cc|cc} 1 & 0 & -5 & 2 \\ 0 & 1 & 3 & -1 \end{array}\right].

因此

A^{-1} = \begin{bmatrix} -5 & 2 \\ 3 & -1 \end{bmatrix}.

重点不只是算出答案，而是看清楚：当左边变成单位矩阵时，右边自然就是逆矩阵。

常见错误

不要把长方形矩阵的一侧逆当成另一侧逆

对于非方阵，左逆不一定等于右逆，甚至不一定存在。方阵则不同：一旦逆矩阵存在，它就同时是左逆和右逆，而且一定唯一。

常见错误

不要只凭外表判断可逆性

一个矩阵看起来简单，也不代表它一定可逆。正确方法是行化简，或者使用上面列出的等价条件。

练习

快速检查

假设 $A$ 可逆，而且 $AB = I_p$ 。证明 $B = A^{-1}$ 。

可以利用逆矩阵唯一性，也可以左乘 $A^{-1}$ 。

解答

引导解答

先读这些页

这一页特别依赖 2.3 高斯消元与 RREF、 3.1 矩阵乘法与单位矩阵和 3.2 转置与特殊矩阵。

MATH1030：线性代数 I

左逆和右逆

左逆与右逆

可逆矩阵

逆矩阵是唯一的

为什么逆矩阵唯一

什么叫可逆

对角矩阵最容易看出逆矩阵

行化简和逆矩阵

行变换矩阵是可逆的

可逆性和行化简

跟着看一个用行化简求逆的例子

跟着走完一条行化简路径

等价表述

识别可逆矩阵的等价条件

从可逆矩阵角度理解行等价

行等价等同于左乘一个可逆矩阵

把行等价读成一条矩阵等式

行变换保留对应列向量之间的线性关系

为什么 RREF 是唯一的

每个行等价类只有一个最简行阶梯形

秩

列向量的无关与线性组合

可逆性和列向量

转置和幂次

转置与幂次

例题

用行化简求逆矩阵

常见错误

不要把长方形矩阵的一侧逆当成另一侧逆

不要只凭外表判断可逆性

快速检查

如果 AAA 可逆，A−1AA^{-1}AA−1A 是什么？

答案

如果 AAA 可逆，齐次方程组 Ax=0Ax = 0Ax=0 会不会有非零解？

答案

如果 AAA 可逆，AtA^tAt 是否可逆？

答案

若 B=GAB = GAB=GA，而 GGG 可逆，同时 AAA 的列满足 a3=2a1−a2a_3 = 2a_1 - a_2a3​=2a1​−a2​，那么 BBB 的对应列必须满足什么关系？

答案

为什么定义 rank 时，RREF 的唯一性这么重要？

答案

练习

假设 AAA 可逆，而且 AB=IpAB = I_pAB=Ip​。证明 B=A−1B = A^{-1}B=A−1。

引导解答

先读这些页

本节掌握 checkpoint

先备知识

本单元重点词汇

本系列更多笔记

如果 $A$ 可逆， $A^{-1}A$ 是什么？

如果 $A$ 可逆，齐次方程组 $Ax = 0$ 会不会有非零解？

如果 $A$ 可逆， $A^t$ 是否可逆？

若 $B = GA$ ，而 $G$ 可逆，同时 $A$ 的列满足 $a_3 = 2a_1 - a_2$ ，那么 $B$ 的对应列必须满足什么关系？

假设 $A$ 可逆，而且 $AB = I_p$ 。证明 $B = A^{-1}$ 。