Evanalysis
3.3預計閱讀時間: 13 分鐘

3.3 行變換矩陣

把初等行變換轉化為左乘初等矩陣,並用反向行變換理解這些矩陣為何可逆。

行變換最初是矩陣上的操作步驟:交換兩行、把一行乘以非零純量、把一行的倍數 加到另一行。這些操作已經可以用來解方程組,因為它們保留解集。

但同一件事還有一個更有結構的讀法:每一個初等行變換,都等同於左乘某個特別 的方陣。這個觀點很重要,因為它把一串行變換轉成普通的矩陣等式。之後討論 行化簡、可逆性、秩、行列式和基底時,這正是程序性操作和代數結構之間的橋。

核心想法:先把行變換作用在單位矩陣上

假設一個行變換 ρ\rho 作用於有 p 行的矩陣。先從單位矩陣 IpI_p 開始, 對 IpI_p 做同一個行變換,所得矩陣記作 EρE_\rho

定義

行變換矩陣

p 行矩陣上的行變換 ρ\rho 對應的 行變換矩陣,就是把 ρ\rho 作用在 IpI_p 上所得的 p×pp \times p 矩陣。

換句話說,

Eρ=ρ(Ip).E_\rho = \rho(I_p).

這個定義有用,是因為以下定理。

定理

行變換等同於左乘矩陣

AA 是任何有 p 行的矩陣,並以 ρ(A)\rho(A) 表示對 AA 做行變換 ρ\rho 後得到的矩陣。則

ρ(A)=EρA.\rho(A) = E_\rho A.

所以,對 AA 做一個行變換,等同於用同一個行變換在 IpI_p 上得到的 行變換矩陣左乘 AA

這裏必須是左乘。行變換改變的是行,會把新行寫成舊行的線性組合;左乘正是把 AA 的新行寫成舊行的線性組合。右乘則會混合列,不是同一件事。

三個基本例子

三種合法行變換,對應三種行變換矩陣。

例題

行加法

對有三行的矩陣,考慮

ρ:R2R2+3R1.\rho:\quad R_2 \leftarrow R_2 + 3R_1.

把它作用在 I3I_3 上:

I3=[100010001]Eρ=[100310001].I_3 = \begin{bmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix} \quad\longmapsto\quad E_\rho = \begin{bmatrix} 1 & 0 & 0\\ 3 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix}.

因此,對任何有三行的矩陣 AA

EρAE_\rho A

就是把 AA 的第 2 行改成「第 2 行加上 3 倍第 1 行」後所得的矩陣。

例題

行倍乘

ρ:R32R3,\rho:\quad R_3 \leftarrow -2R_3,

對應的行變換矩陣是

Eρ=[100010002].E_\rho = \begin{bmatrix} 1 & 0 & 0\\ 0 & 1 & 0\\ 0 & 0 & -2 \end{bmatrix}.

行倍乘要求純量非零,這一點在矩陣上也看得出來:如果倍數是 0,所得矩陣會 出現零行,不能反向恢復。

例題

交換兩行

ρ:R1R3,\rho:\quad R_1 \leftrightarrow R_3,

我們得到

Eρ=[001010100].E_\rho = \begin{bmatrix} 0 & 0 & 1\\ 0 & 1 & 0\\ 1 & 0 & 0 \end{bmatrix}.

左乘這個矩陣,就會交換任何相容矩陣的第 1 行和第 3 行。

一串行變換就是一個矩陣乘積

真正的用途不只是表示單一步驟,而是把整串行變換寫成一個矩陣乘積。

定理

一串行變換的乘積表示

假設

A1ρ1A2ρ2A3ρ3ρkAk+1.A_1 \xrightarrow{\rho_1} A_2 \xrightarrow{\rho_2} A_3 \xrightarrow{\rho_3} \cdots \xrightarrow{\rho_k} A_{k+1}.

Ak+1=EρkEρk1Eρ2Eρ1A1.A_{k+1} = E_{\rho_k}E_{\rho_{k-1}}\cdots E_{\rho_2}E_{\rho_1}A_1.

這個公式中的次序很重要。第一個行變換最靠近 A1A_1,因為它最先作用:

A2=Eρ1A1,A3=Eρ2A2=Eρ2Eρ1A1.A_2 = E_{\rho_1}A_1, \qquad A_3 = E_{\rho_2}A_2 = E_{\rho_2}E_{\rho_1}A_1.

例題

合併兩個行變換

A=[101021100].A = \begin{bmatrix} 1 & 0 & 1\\ 0 & 2 & 1\\ 1 & 0 & 0 \end{bmatrix}.

依次做

ρ1: R2R2+R1,ρ2: R1R1+2R2.\rho_1:\ R_2 \leftarrow R_2 + R_1, \qquad \rho_2:\ R_1 \leftarrow R_1 + 2R_2.

對應的行變換矩陣是

Eρ1=[100110001],Eρ2=[120010001].E_{\rho_1} = \begin{bmatrix} 1 & 0 & 0\\ 1 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix}, \qquad E_{\rho_2} = \begin{bmatrix} 1 & 2 & 0\\ 0 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix}.

兩個操作完成後,結果就是

Eρ2Eρ1A.E_{\rho_2}E_{\rho_1}A.

若不想直接相乘 Eρ2Eρ1E_{\rho_2}E_{\rho_1},也可以把同一串行變換按同一次序作用在 I3I_3 上,所得矩陣就是合併後的左乘矩陣。

讀懂較長的行變換乘積

在功課式題目裏,行變換經常會以一長串步驟出現。重點不是盲目相乘很多矩陣, 而是把三種對象分清楚:

  • 正在被變換的矩陣 A1,A2,,Ak+1A_1,A_2,\ldots,A_{k+1}
  • 每一步對應的行變換矩陣 H1,H2,,HkH_1,H_2,\ldots,H_k
  • 合併後的單一左乘矩陣 J=HkH2H1J=H_k\cdots H_2H_1

以下是一個四行矩陣的典型例子。假設

ρ1:R212R2,ρ2:R1R2,ρ3:R3R32R1,ρ4:R4R42R3,ρ5:R1R1R3,ρ6:R1R1R2.\begin{aligned} \rho_1 &: R_2 \leftarrow -\frac12 R_2,\\ \rho_2 &: R_1 \leftrightarrow R_2,\\ \rho_3 &: R_3 \leftarrow R_3-2R_1,\\ \rho_4 &: R_4 \leftarrow R_4-2R_3,\\ \rho_5 &: R_1 \leftarrow R_1-R_3,\\ \rho_6 &: R_1 \leftarrow R_1-R_2. \end{aligned}

如果

A1ρ1A2ρ2A3ρ3A4ρ4A5ρ5A6ρ6A7,A_1 \xrightarrow{\rho_1} A_2 \xrightarrow{\rho_2} A_3 \xrightarrow{\rho_3} A_4 \xrightarrow{\rho_4} A_5 \xrightarrow{\rho_5} A_6 \xrightarrow{\rho_6} A_7,

那麼

A7=H6H5H4H3H2H1A1.A_7 = H_6H_5H_4H_3H_2H_1A_1.

相應的行變換矩陣是

H1=[10000120000100001],H2=[0100100000100001],H3=[1000010020100001],H4=[1000010000100021],H5=[1010010000100001],H6=[1100010000100001].\begin{aligned} H_1&= \begin{bmatrix} 1&0&0&0\\ 0&-\frac12&0&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix}, & H_2&= \begin{bmatrix} 0&1&0&0\\ 1&0&0&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix},\\[0.8em] H_3&= \begin{bmatrix} 1&0&0&0\\ 0&1&0&0\\ -2&0&1&0\\ 0&0&0&1 \end{bmatrix}, & H_4&= \begin{bmatrix} 1&0&0&0\\ 0&1&0&0\\ 0&0&1&0\\ 0&0&-2&1 \end{bmatrix},\\[0.8em] H_5&= \begin{bmatrix} 1&0&-1&0\\ 0&1&0&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix}, & H_6&= \begin{bmatrix} 1&-1&0&0\\ 0&1&0&0\\ 0&0&1&0\\ 0&0&0&1 \end{bmatrix}. \end{aligned}

它們的乘積是

J=H6H5H4H3H2H1=[13210100001100221].J=H_6H_5H_4H_3H_2H_1= \begin{bmatrix} -1&-\frac32&-1&0\\ 1&0&0&0\\ 0&1&1&0\\ 0&-2&-2&1 \end{bmatrix}.

有效率的做法,是把六個行變換依次作用在 I4I_4 上,而不是手動展開六個因子。 矩陣 JJ 記錄了整串步驟對行的總作用:

A7=JA1.A_7=JA_1.

這個等式也可用來檢查乘積次序。如果把第一步放在最左邊,所得乘積會描述另一 串不同的操作。

快速檢查

在上面六步行變換中,若 KK 是由 A7A_7 反向回到 A1A_1 的行變換矩陣乘積,JJKK 應滿足甚麼等式?

KK 想成抵消 JJ 總作用的矩陣。

解答

答案

反向行變換與逆矩陣

每個初等行變換都有反向操作:

  • RjRj+cRiR_j \leftarrow R_j + cR_i 的反向操作是 RjRjcRiR_j \leftarrow R_j - cR_i
  • RicRiR_i \leftarrow cR_i(其中 c0c \ne 0)的反向操作是 R_i \leftarrow (1/c)R_i
  • 交換兩行的反向操作仍然是同一次交換。

這給出一個乾淨的矩陣敘述。

定理

行變換矩陣都是可逆矩陣

每個行變換矩陣都是可逆的。它的逆矩陣,就是反向行變換所對應的行變換矩陣。

例如,若

E=[100310001]E = \begin{bmatrix} 1 & 0 & 0\\ 3 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix}

表示 R2R2+3R1R_2 \leftarrow R_2 + 3R_1,則

E1=[100310001]E^{-1} = \begin{bmatrix} 1 & 0 & 0\\ -3 & 1 & 0\\ 0 & 0 & 1 \end{bmatrix}

表示 R2R23R1R_2 \leftarrow R_2 - 3R_1

這就是行變換可逆的代數原因,也解釋了為甚麼行化簡和可逆矩陣有密切關係。

為甚麼這個觀點之後會有用?

如果 BBAA 行等價,則存在一串有限的行變換把 AA 變成 BB。因此存在 某個行變換矩陣的乘積 EE,使得

B=EA.B = EA.

由於每個行變換矩陣都可逆,乘積 EE 也可逆。因此行等價既可以用操作步驟來 描述,也可以用左邊乘上一個可逆矩陣的等式來描述。

這個觀點會在多個地方使用:

  • 一個方陣若行等價於 InI_n,它就是若干行變換矩陣的乘積;
  • 行變換保留齊次方程組的解資訊,因為它等同於左乘可逆矩陣;
  • 行列式關於行變換的規則,可以透過初等矩陣來表述;
  • 秩和基底的論證可以使用行化簡,同時清楚知道原矩陣的列本身通常已被改變。

常見錯誤

常見錯誤

不要乘錯方向

行變換由左乘表示。右乘會混合列,而不是混合行。

常見錯誤

不要把乘積次序反過來

如果 ρ1\rho_1 先於 ρ2\rho_2 作用,合併矩陣是 Eρ2Eρ1E_{\rho_2}E_{\rho_1},不是 Eρ1Eρ2E_{\rho_1}E_{\rho_2}

常見錯誤

不能把某一行乘以零

行倍乘要求純量非零。把一行乘以 0 不能反向恢復,也不會產生可逆的 行變換矩陣。

快速檢查

快速檢查

對有三行的矩陣,E=[100010501]E = \begin{bmatrix} 1&0&0\\0&1&0\\5&0&1 \end{bmatrix} 表示哪個行變換?

I3I_3 的哪一行被改變。

解答

答案

快速檢查

R2R24R1R_2 \leftarrow R_2 - 4R_1 的反向行變換是甚麼?

把加上的倍數抵消。

解答

答案

練習

快速檢查

寫出有三行矩陣上 R1R2R_1 \leftrightarrow R_2 的行變換矩陣。

把這個交換作用在 I3I_3 上。

解答

引導解答

快速檢查

假設 BBAA 經以下兩步得到:先做 R2R2+R1R_2 \leftarrow R_2 + R_1,再做 R32R3R_3 \leftarrow 2R_3。把 BB 寫成涉及 AA 的矩陣乘積。

按照作用次序命名兩個行變換矩陣。

解答

引導解答

快速檢查

β1,β20\beta_1,\beta_2\ne 0。假設五行矩陣 AA 經以下行變換鏈得到 BB:先做 α1R1+R3\alpha_1R_1+R_3,再做 β1R2\beta_1R_2,再做 R1R4R_1\leftrightarrow R_4,再做 α2R2+R3\alpha_2R_2+R_3,最後做 β2R1\beta_2R_1。寫出單一矩陣 GG,使得 B=GAB=GA

把同一串操作作用在 I5I_5 上,並記住後面的操作使用的是當時的行,不是原來的行。

解答

引導解答

快速檢查

沿用上一題的矩陣 GG,假設 D=GCD=GC。寫出矩陣 HH,使得 C=HDC=HD

把行變換按相反次序逐步撤銷。

解答

引導解答

相關筆記

這一頁建立在 2.2 增廣矩陣與行變換3.1 矩陣乘法與單位矩陣 之上。它也準備了 5.1 可逆矩陣7.2 行變換、乘積與可逆性 中使用的行化簡代數觀點。

本節掌握 checkpoint

要完成這一節 checkpoint,需要把每一題答對。 答對進度: 0%.

技能點: elementary-matrix, row-operation, matrix-multiplication

3 x 3 矩陣,哪個初等矩陣表示 R2<R2+3R1R_2 <- R_2 + 3R_1

已用嘗試次數: 0

剩餘嘗試次數: 不限嘗試次數

預覽不會消耗嘗試次數。

提交會記錄一次正式評分嘗試。

技能點: row-operation-matrix, inverse, matrix-product-order

一串六步行變換把 A1A_1 變成 A7A_7,合併後的左乘矩陣是 JJ,所以 A7=JA1A_7=JA_1。若 KK 是反向步驟的合併左乘矩陣,下列哪一項必定成立?

已用嘗試次數: 0

剩餘嘗試次數: 不限嘗試次數

預覽不會消耗嘗試次數。

提交會記錄一次正式評分嘗試。

技能點: row-operation-matrix, parameters, matrix-product-order

在一串五行行變換中,先把 R2R_2 換成 β1R2\beta_1 R_2,後來再做 R3R3+α2R2R_3 \leftarrow R_3 + \alpha_2 R_2。在合併乘數 GG 中,位置 (3,2) 的項是甚麼?

已用嘗試次數: 0

剩餘嘗試次數: 不限嘗試次數

預覽不會消耗嘗試次數。

提交會記錄一次正式評分嘗試。

技能點: row-operation-matrix, inverse, parameters

某個合併行變換乘數是 GG。若 D=GCD=GC,而 HH 被選成令 C=HDC=HD 成立,則 HHGG 有甚麼關係?

已用嘗試次數: 0

剩餘嘗試次數: 不限嘗試次數

預覽不會消耗嘗試次數。

提交會記錄一次正式評分嘗試。

本單元重點詞彙