Evanalysis
3.3预计阅读时间: 13 分钟

3.3 行变换矩阵

把初等行变换转化为左乘初等矩阵,并用反向行变换理解这些矩阵为何可逆。

行变换最初是矩阵上的操作步骤:交换两行、把一行乘以非零标量、把一行的倍数 加到另一行。这些操作已经可以用来解方程组,因为它们保留解集。

但同一件事还有一个更有结构的读法:每一个初等行变换,都等同于左乘某个特别 的方阵。这个观点很重要,因为它把一串行变换转成普通的矩阵等式。之后讨论 行化简、可逆性、秩、行列式和基时,这正是程序性操作和代数结构之间的桥。

核心想法:先把行变换作用在单位矩阵上

假设一个行变换 ρ\rho 作用于有 p 行的矩阵。先从单位矩阵 IpI_p 开始, 对 IpI_p 做同一个行变换,所得矩阵记作 EρE_\rho

定义

行变换矩阵

p 行矩阵上的行变换 ρ\rho 对应的 行变换矩阵,就是把 ρ\rho 作用在 IpI_p 上所得的 p×pp \times p 矩阵。

换句话说,

Eρ=ρ(Ip).E_\rho = \rho(I_p).

这个定义有用,是因为以下定理。

定理

行变换等同于左乘矩阵

AA 是任何有 p 行的矩阵,并以 ρ(A)\rho(A) 表示对 AA 做行变换 ρ\rho 后得到的矩阵。则

ρ(A)=EρA.\rho(A) = E_\rho A.

所以,对 AA 做一个行变换,等同于用同一个行变换在 IpI_p 上得到的 行变换矩阵左乘 AA

这里必须是左乘。行变换改变的是行,会把新行写成旧行的线性组合;左乘正是把 AA 的新行写成旧行的线性组合。右乘则会混合列,不是同一件事。

三个基本例子

三种合法行变换,对应三种行变换矩阵。

例题

行加法

对有三行的矩阵,考虑

ρ:R2R2+3R1.\rho:\quad R_2 \leftarrow R_2 + 3R_1.

把它作用在 I3I_3 上:

I3=[100010001]Eρ=[100310001].I_3 = \begin{bmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix} \quad\longmapsto\quad E_\rho = \begin{bmatrix} 1 & 0 & 0\\ 3 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix}.

因此,对任何有三行的矩阵 AA

EρAE_\rho A

就是把 AA 的第 2 行改成“第 2 行加上 3 倍第 1 行”后所得的矩阵。

例题

行倍乘

ρ:R32R3,\rho:\quad R_3 \leftarrow -2R_3,

对应的行变换矩阵是

Eρ=[100010002].E_\rho = \begin{bmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & -2 \end{bmatrix}.

行倍乘要求标量非零,这一点在矩阵上也看得出来:如果倍数是 0,所得矩阵会 出现零行,不能反向恢复。

例题

交换两行

ρ:R1R3,\rho:\quad R_1 \leftrightarrow R_3,

我们得到

Eρ=[001010100].E_\rho = \begin{bmatrix} 0 & 0 & 1\\ 0 & 1 & 0\\ 1 & 0 & 0 \end{bmatrix}.

左乘这个矩阵,就会交换任何相容矩阵的第 1 行和第 3 行。

一串行变换就是一个矩阵乘积

真正的用途不只是表示单一步骤,而是把整串行变换写成一个矩阵乘积。

定理

一串行变换的乘积表示

假设

A1ρ1A2ρ2A3ρ3ρkAk+1.A_1 \xrightarrow{\rho_1} A_2 \xrightarrow{\rho_2} A_3 \xrightarrow{\rho_3} \cdots \xrightarrow{\rho_k} A_{k+1}.

Ak+1=EρkEρk1Eρ2Eρ1A1.A_{k+1} = E_{\rho_k}E_{\rho_{k-1}}\cdots E_{\rho_2}E_{\rho_1}A_1.

这个公式中的顺序很重要。第一个行变换最靠近 A1A_1,因为它最先作用:

A2=Eρ1A1,A3=Eρ2A2=Eρ2Eρ1A1.A_2 = E_{\rho_1}A_1, \qquad A_3 = E_{\rho_2}A_2 = E_{\rho_2}E_{\rho_1}A_1.

例题

合并两个行变换

A=[101021100].A = \begin{bmatrix} 1 & 0 & 1\\ 0 & 2 & 1\\ 1 & 0 & 0 \end{bmatrix}.

依次做

ρ1: R2R2+R1,ρ2: R1R1+2R2.\rho_1:\ R_2 \leftarrow R_2 + R_1, \qquad \rho_2:\ R_1 \leftarrow R_1 + 2R_2.

对应的行变换矩阵是

Eρ1=[100110001],Eρ2=[120010001].E_{\rho_1} = \begin{bmatrix} 1 & 0 & 0\\ 1 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix}, \qquad E_{\rho_2} = \begin{bmatrix} 1 & 2 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix}.

两个操作完成后,结果就是

Eρ2Eρ1A.E_{\rho_2}E_{\rho_1}A.

若不想直接相乘 Eρ2Eρ1E_{\rho_2}E_{\rho_1},也可以把同一串行变换按同一顺序作用在 I3I_3 上,所得矩阵就是合并后的左乘矩阵。

读懂较长的行变换乘积

在作业式题目里,行变换经常会以一长串步骤出现。重点不是盲目相乘很多矩阵, 而是把三种对象分清楚:

  • 正在被变换的矩阵 A1,A2,,Ak+1A_1,A_2,\ldots,A_{k+1}
  • 每一步对应的行变换矩阵 H1,H2,,HkH_1,H_2,\ldots,H_k
  • 合并后的单一左乘矩阵 J=HkH2H1J=H_k\cdots H_2H_1

以下是一个四行矩阵的典型例子。假设

ρ1:R212R2,ρ2:R1R2,ρ3:R3R32R1,ρ4:R4R42R3,ρ5:R1R1R3,ρ6:R1R1R2.\begin{aligned} \rho_1 &: R_2 \leftarrow -\frac12 R_2,\\ \rho_2 &: R_1 \leftrightarrow R_2,\\ \rho_3 &: R_3 \leftarrow R_3-2R_1,\\ \rho_4 &: R_4 \leftarrow R_4-2R_3,\\ \rho_5 &: R_1 \leftarrow R_1-R_3,\\ \rho_6 &: R_1 \leftarrow R_1-R_2. \end{aligned}

如果

A1ρ1A2ρ2A3ρ3A4ρ4A5ρ5A6ρ6A7,A_1 \xrightarrow{\rho_1} A_2 \xrightarrow{\rho_2} A_3 \xrightarrow{\rho_3} A_4 \xrightarrow{\rho_4} A_5 \xrightarrow{\rho_5} A_6 \xrightarrow{\rho_6} A_7,

那么

A7=H6H5H4H3H2H1A1.A_7 = H_6H_5H_4H_3H_2H_1A_1.

相应的行变换矩阵是

H1=[10000120000100001],H2=[0100100000100001],H3=[1000010020100001],H4=[1000010000100021],H5=[1010010000100001],H6=[1100010000100001].\begin{aligned} H_1&= \begin{bmatrix} 1&0&0&0\\ 0&-\frac12&0&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix}, & H_2&= \begin{bmatrix} 0&1&0&0\\ 1&0&0&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix},\\[0.8em] H_3&= \begin{bmatrix} 1&0&0&0\\ 0&1&0&0\\ -2&0&1&0\\ 0&0&0&1 \end{bmatrix}, & H_4&= \begin{bmatrix} 1&0&0&0\\ 0&1&0&0\\ 0&0&1&0\\ 0&0&-2&1 \end{bmatrix},\\[0.8em] H_5&= \begin{bmatrix} 1&0&-1&0\\ 0&1&0&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix}, & H_6&= \begin{bmatrix} 1&-1&0&0\\ 0&1&0&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix}. \end{aligned}

它们的乘积是

J=H6H5H4H3H2H1=[13210100001100221].J=H_6H_5H_4H_3H_2H_1= \begin{bmatrix} -1&-\frac32&-1&0\\ 1&0&0&0\\ 0&1&1&0\\ 0&-2&-2&1 \end{bmatrix}.

有效率的做法,是把六个行变换依次作用在 I4I_4 上,而不是手动展开六个因子。 矩阵 JJ 记录了整串步骤对行的总作用:

A7=JA1.A_7=JA_1.

这个等式也可用来检查乘积顺序。如果把第一步放在最左边,所得乘积会描述另一 串不同的操作。

快速检查

在上面六步行变换中,若 KK 是由 A7A_7 反向回到 A1A_1 的行变换矩阵乘积,JJKK 应满足什么等式?

KK 想成抵消 JJ 总作用的矩阵。

解答

答案

反向行变换与逆矩阵

每个初等行变换都有反向操作:

  • RjRj+cRiR_j \leftarrow R_j + cR_i 的反向操作是 RjRjcRiR_j \leftarrow R_j - cR_i
  • RicRiR_i \leftarrow cR_i(其中 c0c \ne 0)的反向操作是 R_i \leftarrow (1/c)R_i
  • 交换两行的反向操作仍然是同一次交换。

这给出一个干净的矩阵表述。

定理

行变换矩阵都是可逆矩阵

每个行变换矩阵都是可逆的。它的逆矩阵,就是反向行变换所对应的行变换矩阵。

例如,若

E=[100310001]E = \begin{bmatrix} 1 & 0 & 0\\ 3 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix}

表示 R2R2+3R1R_2 \leftarrow R_2 + 3R_1,则

E1=[100310001]E^{-1} = \begin{bmatrix} 1 & 0 & 0\\ -3 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix}

表示 R2R23R1R_2 \leftarrow R_2 - 3R_1

这就是行变换可逆的代数原因,也解释了为什么行化简和可逆矩阵有密切关系。

为什么这个观点之后会有用?

如果 BBAA 行等价,则存在一串有限的行变换把 AA 变成 BB。因此存在 某个行变换矩阵的乘积 EE,使得

B=EA.B = EA.

由于每个行变换矩阵都可逆,乘积 EE 也可逆。因此行等价既可以用操作步骤来 描述,也可以用左边乘上一个可逆矩阵的等式来描述。

这个观点会在多个地方使用:

  • 一个方阵若行等价于 InI_n,它就是若干行变换矩阵的乘积;
  • 行变换保留齐次方程组的解信息,因为它等同于左乘可逆矩阵;
  • 行列式关于行变换的规则,可以通过初等矩阵来表述;
  • 秩和基的论证可以使用行化简,同时清楚知道原矩阵的列本身通常已被改变。

常见错误

常见错误

不要乘错方向

行变换由左乘表示。右乘会混合列,而不是混合行。

常见错误

不要把乘积顺序反过来

如果 ρ1\rho_1 先于 ρ2\rho_2 作用,合并矩阵是 Eρ2Eρ1E_{\rho_2}E_{\rho_1},不是 Eρ1Eρ2E_{\rho_1}E_{\rho_2}

常见错误

不能把某一行乘以零

行倍乘要求标量非零。把一行乘以 0 不能反向恢复,也不会产生可逆的 行变换矩阵。

快速检查

快速检查

对有三行的矩阵,E=[100010501]E = \begin{bmatrix} 1&0&0\\0&1&0\\5&0&1 \end{bmatrix} 表示哪个行变换?

I3I_3 的哪一行被改变。

解答

答案

快速检查

R2R24R1R_2 \leftarrow R_2 - 4R_1 的反向行变换是什么?

把加上的倍数抵消。

解答

答案

练习

快速检查

写出有三行矩阵上 R1R2R_1 \leftrightarrow R_2 的行变换矩阵。

把这个交换作用在 I3I_3 上。

解答

引导解答

快速检查

假设 BBAA 经以下两步得到:先做 R2R2+R1R_2 \leftarrow R_2 + R_1,再做 R32R3R_3 \leftarrow 2R_3。把 BB 写成涉及 AA 的矩阵乘积。

按照作用顺序命名两个行变换矩阵。

解答

引导解答

快速检查

β1,β20\beta_1,\beta_2\ne 0。假设五行矩阵 AA 经以下行变换链得到 BB:先做 α1R1+R3\alpha_1R_1+R_3,再做 β1R2\beta_1R_2,再做 R1R4R_1\leftrightarrow R_4,再做 α2R2+R3\alpha_2R_2+R_3,最后做 β2R1\beta_2R_1。写出单一矩阵 GG,使得 B=GAB=GA

把同一串操作作用在 I5I_5 上,并记住后面的操作使用的是当时的行,不是原来的行。

解答

引导解答

快速检查

沿用上一题的矩阵 GG,假设 D=GCD=GC。写出矩阵 HH,使得 C=HDC=HD

把行变换按相反顺序逐步撤销。

解答

引导解答

相关笔记

这一页建立在 2.2 增广矩阵与行变换3.1 矩阵乘法与单位矩阵 之上。它也准备了 5.1 可逆矩阵7.2 行变换、乘积与可逆性 中使用的行化简代数观点。

本节掌握 checkpoint

要完成这一节 checkpoint,需要把每一题答对。 答对进度: 0%.

技能点: elementary-matrix, row-operation, matrix-multiplication

3 x 3 矩阵,哪个初等矩阵表示 R2<R2+3R1R_2 <- R_2 + 3R_1

已用尝试次数: 0

剩余尝试次数: 不限尝试次数

预览不会消耗尝试次数。

提交会记录一次正式评分尝试。

技能点: row-operation-matrix, inverse, matrix-product-order

一串六步行变换把 A1A_1 变成 A7A_7,合并后的左乘矩阵是 JJ,所以 A7=JA1A_7=JA_1。若 KK 是反向步骤的合并左乘矩阵,下列哪一项必定成立?

已用尝试次数: 0

剩余尝试次数: 不限尝试次数

预览不会消耗尝试次数。

提交会记录一次正式评分尝试。

技能点: row-operation-matrix, parameters, matrix-product-order

在一串五行行变换中,先把 R2R_2 换成 β1R2\beta_1 R_2,后来再做 R3R3+α2R2R_3 \leftarrow R_3 + \alpha_2 R_2。在合并乘数 GG 中,位置 (3,2) 的项是什么?

已用尝试次数: 0

剩余尝试次数: 不限尝试次数

预览不会消耗尝试次数。

提交会记录一次正式评分尝试。

技能点: row-operation-matrix, inverse, parameters

某个合并行变换乘数是 GG。若 D=GCD=GC,而 HH 被选成令 C=HDC=HD 成立,则 HHGG 有什么关系?

已用尝试次数: 0

剩余尝试次数: 不限尝试次数

预览不会消耗尝试次数。

提交会记录一次正式评分尝试。

本单元重点词汇