可逆性是线性代数中最早让你感受到“一个矩阵表示一个可逆过程”的地方。对于方阵,如果它可逆,就表示有另一个方阵能够把它完全还原。更重要的是,这个概念和许多其他说法其实等价:可以行化简成单位矩阵、每个方程组 都有解、列向量线性无关,以及矩阵乘法可以被系统地反向处理。
这一页会把这些等价关系分开讲清楚。目标不只是会写 ,而是能严格判断一个方阵什么时候可逆,以及怎样可靠地算出它的逆矩阵。
左逆和右逆
先不要直接进入方阵。对一般矩阵,左逆和右逆是两个不同概念。
定义
左逆与右逆
设 是一个 矩阵。
- 如果一个 矩阵 满足 ,那么 是 的左逆。
- 如果一个 矩阵 满足 ,那么 是 的右逆。
这两个定义很重要,因为矩阵乘法不交换。对于长方形矩阵,左逆和右逆不一定同时存在;即使都存在,也不一定相同。方阵的情况更特殊。
定义
可逆矩阵
如果 是一个 方阵,并且存在另一个 矩阵 使得
那么 称为可逆。矩阵 称为 的逆矩阵,记作 。
定理
逆矩阵是唯一的
如果 是 的左逆,而 是 的右逆,那么 。所以可逆矩阵只有一个逆矩阵。
证明
为什么逆矩阵唯一
什么叫可逆
可逆本质上就是“可以完全反过来”。 做一次变换之后,如果 存在, 就能把结果准确地拉回原位。
单位矩阵 之所以出现,是因为它不会改变任何向量:
对任何相容向量 x 都成立。逆矩阵就是让你回到这个“不被改变”的状态的矩阵。
例题
对角矩阵最容易看出逆矩阵
设
那么
原因很直接:对角线上的非零元素变成倒数,其余位置的零保持不变。把 和 相乘,就会得到 。
行化简和逆矩阵
实际计算逆矩阵时,最可靠的方法是行化简。课程材料的核心想法分成两步:
- 行变换矩阵本身可逆,而且它的逆就是反向行变换矩阵;
- 一个方阵可逆,当且仅当它能够被行化简到 。
定理
行变换矩阵是可逆的
如果 是一个对 p 行矩阵进行的行变换,而 是对应的反向行变换,那么行变换矩阵 和 满足
所以每一步行化简,其实都是在左乘一个可逆矩阵。这个观点会让后面的很多证明更清楚。
定理
可逆性和行化简
对一个方阵 ,以下命题等价:
- 可逆;
- 与 行等价;
- 是若干个行变换矩阵的乘积;
- 是非奇异矩阵。
所以当你把 和 并排写成 ,再做行化简时, 如果左边最后变成 ,右边就会读出 。
边读边试
跟着看一个用行化简求逆的例子
互动示范让你逐步把 [A | I] 化简,直到左边变成 I。
由 [A | I] 开始。若 A 可逆,行化简会把左边化成 I。
| 1 | 2 | 1 | 1 | 0 | 0 |
| 0 | 1 | 1 | 0 | 1 | 0 |
| 2 | 3 | 4 | 0 | 0 | 1 |
上面的交互示范直接展示“把 [A | I] 化到左边变成 ”到底是什么意思。它不是定义本身,而是和定义完全一致的计算方法。
边读边试
跟着走完一条行化简路径
互动步骤器会带你走完一条完整的消元路径,逐步显示行变换、正在处理的主元,以及每一步得到的矩阵。
| 1 | 2 | 2 | 4 |
| 1 | 3 | 3 | 5 |
| 2 | 6 | 5 | 6 |
行变换
先在第 1 列选主元。
要留意什么
第 1 列的第一行已经有方便的主元 1,所以暂时不用换行。
先由增广矩阵开始。第一个主元的工作,是帮我们把它下面的元素清掉。
第二个交互工具显示一条完整的消元路径。对于可逆矩阵,重点不是“做了多少步”,而是“左边最后真的化成了 ”。
等价表述
可逆性有一个非常重要的“字典”:它可以用很多不同语言来描述。
定理
识别可逆矩阵的等价条件
设 是一个 矩阵。以下命题等价:
- 可逆。
- 与 行等价。
- 是若干个行变换矩阵的乘积。
- 有左逆。
- 有右逆。
- 是非奇异矩阵。
- 对每个
p维列向量b,方程组 都相容。 - 对每个
p维列向量b,方程组 都有唯一解,且解为 。
其中两个最实用:
- 第 7 点说明: 的列向量张成 。
- 第 8 点说明:一旦可逆,就不只是“有解”,而是可以直接写出解。
所以可逆性正是矩阵解方程组时最核心的代数条件。
从可逆矩阵角度理解行等价
现在把行变换观点再向前推进一步:不只把行等价理解成一连串行变换,而是 把整个过程打包成左边乘上一个可逆矩阵。
定理
行等价等同于左乘一个可逆矩阵
设 和 是有 p 行的矩阵。以下命题等价:
- 和 行等价;
- 存在一个可逆的 矩阵 ,使得
并且一旦 ,就同时有
这个定理不是另一种计算技巧,而是对同一现象更干净的表达。任何有限步行 变换都可以压缩成左边一个可逆矩阵 ;反向行变换则由 编码。
例题
把行等价读成一条矩阵等式
设
矩阵 正是行变换
对应的行变换矩阵。所以
如果把这个新矩阵记作 ,那么就有 。这一条等式已经完整记录了 这次行变换。因为 可逆,所以 和 行等价。
它的理论价值很高。只要知道行等价就是左乘一个可逆矩阵,后面很多“什么量 被保留”的结论都可以一行说明。
定理
行变换保留对应列向量之间的线性关系
设 和 是行等价的 矩阵,并把它们的列写成
如果
那么必然有
特别地,对应列之间的线性相关和线性无关,都会被行等价保留。
一旦知道 ,证明就很短。把 的列关系左乘 ,由矩阵乘法的线 性性质可得
这正是 的对应列满足同一组系数关系。
这个结果就是从行化简走向列语言的桥梁。行变换会改变列向量本身,但不会改 变哪些列是多余的,也不会改变某一列如何由其他列线性表示。
为什么 RREF 是唯一的
在每个行等价类里,最简行阶梯形其实只有一个。这一点很容易被忽略,但它 正是后面定义能够成立的基础。
定理
每个行等价类只有一个最简行阶梯形
设 是一个矩阵, 和 都是 reduced row-echelon form。若 与 行等价,而 也与 行等价,那么
标准证明会对秩做数学归纳。核心策略是:
- 从左到右比较主元列;
- 用“线性关系被保留”来迫出相同的主元位置;
- 再证明每一个自由列都必须以同样的系数由前面的主元列组合而成。
所以 RREF 不只是“某个方便的最后形状”,而是该行等价类中唯一的最后 形状。
定义
秩
一个矩阵的秩,就是它的 reduced row-echelon form 中主元的数目。
这个定义之所以成立,正因为 RREF 是唯一的。如果不同消元路径会得到不同 RREF,那么主元数目就会跟算法一起改变,rank 便不会是良定的。
列向量的无关与线性组合
可逆性也可以用列向量语言来读。
定理
可逆性和列向量
对一个 矩阵 ,以下命题等价:
- 可逆;
- 的列向量线性无关;
- 中每个向量都可以写成 的列向量的线性组合。
这三句话其实是同一件事的三种说法。
如果列向量线性无关,就表示没有一列是多余的。 如果列向量张成 ,就表示每个目标向量都能构造出来。 对方阵来说,这两个条件同时成立,正是可逆。
转置和幂次
可逆性和转置也相容。
定理
转置与幂次
如果 可逆,那么:
- 也可逆,而且 ;
- 对每个整数
n都可逆,而且 。
转置结果方便你把关于列的命题改写成关于行的命题;幂次结果则适合处理重复出现的变换。
例题
例题
用行化简求逆矩阵
设
先写出 :
先消去左下角的 3:
再把第二行除以 ,然后清掉第一行第二列:
因此
重点不只是算出答案,而是看清楚:当左边变成单位矩阵时,右边自然就是逆矩阵。
常见错误
常见错误
不要把长方形矩阵的一侧逆当成另一侧逆
对于非方阵,左逆不一定等于右逆,甚至不一定存在。方阵则不同:一旦逆矩阵存在,它就同时是左逆和右逆,而且一定唯一。
常见错误
不要只凭外表判断可逆性
一个矩阵看起来简单,也不代表它一定可逆。正确方法是行化简,或者使用上面列出的等价条件。
快速检查
快速检查
如果 可逆, 是什么?
直接用逆矩阵的定义。
解答
答案
快速检查
如果 可逆,齐次方程组 会不会有非零解?
用唯一解的结论来想。
解答
答案
快速检查
如果 可逆, 是否可逆?
使用上面的转置定理。
解答
答案
快速检查
若 ,而 可逆,同时 的列满足 ,那么 的对应列必须满足什么关系?
保留同一组系数,并用 。
解答
答案
快速检查
为什么定义 rank 时,RREF 的唯一性这么重要?
用一句话回答,并包含“良定”这个词。
解答
答案
练习
快速检查
假设 可逆,而且 。证明 。
可以利用逆矩阵唯一性,也可以左乘 。
解答
引导解答
先读这些页
这一页特别依赖 2.3 高斯消元与 RREF、 3.1 矩阵乘法与单位矩阵 和 3.2 转置与特殊矩阵。