Evanalysis
8.2預計閱讀時間: 10 分鐘

8.2 對角化與相似

把對角化理解成由特徵向量組成的基變換,再用相似關係說明何時矩陣可以在不改變核心特徵值資料的情況下被簡化。

單一個特徵向量已經有用;若有整組可形成基底的特徵向量,情況就會徹底 改變。

若一個方陣擁有足夠多線性無關的特徵向量,就可以找到一個座標系,使它 在該座標系下變成對角矩陣。到那時候,矩陣的冪、逆矩陣與不少結構問題 都會變得幾乎不需要計算。

為甚麼對角化重要

設一個矩陣作用於 Rn\mathbb{R}^n。在標準基底下,這個作用可能很複 雜,因為不同坐標會互相混合。若改用由特徵向量組成的新基底,則矩陣對 每個基向量的作用就只剩下純量乘法。

而對角矩陣正正就是這樣工作的。

定義

相似

兩個 n×nn\times n 矩陣 AABB 若存在可逆矩陣 SS 使得

S1AS=B,S^{-1}AS=B,

便稱 AABB 相似

相似的意思,是 AABB 其實代表同一個線性變換,只不過採用了不 同基底。

定義

對角化與可對角化

AAn×nn\times n 矩陣。

若存在可逆矩陣 SS 與純量 λ1,,λn\lambda_1,\dots,\lambda_n 使得

S1AS=diag(λ1,,λn),S^{-1}AS=\operatorname{diag}(\lambda_1,\dots,\lambda_n),

則稱 AA 可對角化,而上述等式稱為 AA 的一個 對角化

因此,對角化只是相似的一個特別情況:目標矩陣剛好是對角矩陣。

特徵向量正是對角化矩陣的列

定理

對角化的刻畫

AAn×nn\times n 矩陣,並令

S=[v1 v2  vn]S=[v_1\ v_2\ \cdots\ v_n]

是一個由列向量 v1,,vnv_1,\dots,v_n 組成的可逆矩陣。

下列敘述等價:

  1. 每個 vjv_j 都是 AA 的特徵向量,而對應特徵值為 λj\lambda_j
S1AS=diag(λ1,,λn)S^{-1}AS=\operatorname{diag}(\lambda_1,\dots,\lambda_n)

這條定理是對角化的核心。換基矩陣的列並不是隨便挑的,它們必須是特徵 向量。

等價地,若記 D=diag(λ1,,λn)D=\operatorname{diag}(\lambda_1,\dots,\lambda_n), 則

AS=SD.AS=SD.

這條式子的意思是:

  • AS 的第一列是 Av1Av_1,而 SD 的第一列是 λ1v1\lambda_1v_1
  • AS 的第二列是 Av2Av_2,而 SD 的第二列是 λ2v2\lambda_2v_2
  • 其餘各列同理。

所以單一條矩陣等式 AS=SDAS=SD,其實一次過包住了所有特徵向量方程。

定理

甚麼時候矩陣可對角化

n×nn\times n 矩陣 AA 可對角化,當且僅當它擁有 n 個線性無關的特徵 向量。

這條判準才是你應該記住的版本。對角化不是靠運氣猜一個矩陣 SS,而 是要找出一整組能形成基底的特徵向量。

第一批對角化例子

例題

一個可對角化的上三角矩陣

A=[111022003].A= \begin{bmatrix} 1&1&1\\ 0&2&2\\ 0&0&3 \end{bmatrix}.

假設已知它有特徵向量

u1=[100],u2=[110],u3=[342],u_1= \begin{bmatrix} 1\\0\\0 \end{bmatrix}, \qquad u_2= \begin{bmatrix} 1\\1\\0 \end{bmatrix}, \qquad u_3= \begin{bmatrix} 3\\4\\2 \end{bmatrix},

分別對應特徵值 123

若令

U=[u1 u2 u3],U=[u_1\ u_2\ u_3],

則三個向量線性無關,所以 UU 可逆。因此

U1AU=diag(1,2,3).U^{-1}AU=\operatorname{diag}(1,2,3).

原矩陣本身並不是對角矩陣,但在特徵向量基底下,它就變成對角矩陣。

例題

一個不可對角化的矩陣

考慮

J=[1401].J= \begin{bmatrix} 1&4\\ 0&1 \end{bmatrix}.

它的唯一特徵值是 1,因為

det(JλI)=1λ401λ=(1λ)2.\det(J-\lambda I)= \begin{vmatrix} 1-\lambda&4\\ 0&1-\lambda \end{vmatrix} =(1-\lambda)^2.

現在求 (JI)x=0(J-I)x=0

JI=[0400].J-I= \begin{bmatrix} 0&4\\ 0&0 \end{bmatrix}.

所以 x2=0x_2=0x1x_1 自由。其特徵空間為

span{[10]},\operatorname{span}\left\{ \begin{bmatrix} 1\\0 \end{bmatrix} \right\},

只有一維。對 2×22\times2 矩陣來說,要可對角化便必須有兩個線性無關的 特徵向量,所以 JJ 不可對角化。

相似矩陣會保留特徵值資料

相似不是任意的共軛操作;它會保留矩陣的核心特徵值結構。

定理

相似矩陣有相同特徵多項式

AABB 相似,則

pA(x)=pB(x).p_A(x)=p_B(x).

特別地,AABB 有相同的特徵值。

這正是對角化有意義的原因。由 AA 得到的對角矩陣並不是另一個無關的 光譜對象,而是同一個線性變換在另一組基底下的寫法,只不過那組基底會 把特徵值直接暴露在對角線上。

常見錯誤

特徵多項式相同,不代表一定相似

相似會推出特徵多項式相同,但反過來並不成立。兩個矩陣可以有相同特徵 多項式,卻仍然不相似。

例如

[0100][0000]\begin{bmatrix} 0&1\\ 0&0 \end{bmatrix} \qquad\text{與}\qquad \begin{bmatrix} 0&0\\ 0&0 \end{bmatrix}

都有特徵多項式 x2x^2,但前者並不與零矩陣相似。

對角化令冪與逆矩陣變得容易

假設

A=SDS1,D=diag(λ1,,λn).A=SDS^{-1}, \qquad D=\operatorname{diag}(\lambda_1,\dots,\lambda_n).

則矩陣代數會大幅簡化。

定理

可對角化矩陣的冪、逆與轉置

A=SDS1A=SDS^{-1}DD 是對角矩陣,則對每個正整數 m

Am=SDmS1.A^m=SD^mS^{-1}.

AA 可逆,則 DD 的每個對角線項都非零,而且

A1=SD1S1.A^{-1}=SD^{-1}S^{-1}.

另外,ATA^T 亦可對角化,並且與 AA 具有相同的特徵值。

關鍵在於對角矩陣的冪很好算:

diag(λ1,,λn)m=diag(λ1m,,λnm).\operatorname{diag}(\lambda_1,\dots,\lambda_n)^m =\operatorname{diag}(\lambda_1^m,\dots,\lambda_n^m).

例題

用對角化計算矩陣冪

A=[211121112].A= \begin{bmatrix} 2&1&1\\ 1&2&1\\ 1&1&2 \end{bmatrix}.

若已知

A=Sdiag(4,1,1)S1,A=S\operatorname{diag}(4,1,1)S^{-1},

Am=Sdiag(4m,1,1)S1.A^m=S\operatorname{diag}(4^m,1,1)S^{-1}.

因此真正困難的步驟只在於把矩陣對角化一次。之後所有正整數次方都只需 把 4 改成 4m4^m,而重複的 1 保持不變即可。

快速檢查

快速檢查

對角化矩陣 S 的各列必須是甚麼?

想想方程 AS=SDAS=SD

解答

答案

快速檢查

一個 3×33\times3 矩陣若只有兩個線性無關的特徵向量,可以可對角化嗎?

用刻畫定理回答。

解答

答案

快速檢查

若 A 與 D 相似,而 D 是對角矩陣,則 A 與 D 的特徵值是否相同?

利用相似定理。

解答

答案

練習

快速檢查

若 A 有特徵向量 v1,v2,v3v_1,v_2,v_3,對應特徵值 2,5,12,5,-1,且三者線性無關,那在 A 的一個對角化中會出現哪個對角矩陣?

把對角線順序與特徵向量順序對齊。

解答

引導解答

快速檢查

解釋為甚麼 [1101]\begin{bmatrix}1&1\\0&1\end{bmatrix} 不可對角化。

檢查它到底有多少個線性無關特徵向量。

解答

引導解答

快速檢查

A=SDS1A=SDS^{-1},而 D=diag(2,1)D=\operatorname{diag}(2,-1),求 A3A^3

用可對角化矩陣的冪公式。

解答

引導解答

相關筆記

若你對特徵值與零空間的關係仍未穩固,應先回看 8.1 特徵值、特徵向量與特徵空間

接着可讀 8.3 特徵多項式與對角化測試, 因為那一節會提供判斷「是否有足夠特徵向量」的多項式工具。

本節使用的基底語言亦依賴 6.5 基底與維數

本節掌握 checkpoint

要完成這一節 checkpoint,需要把每一題答對。 答對進度: 0%.

技能點: diagonalization, eigenvector, basis

對一個 n×n 矩陣 A 來說,哪一項才是正確的可對角化判準?

已用嘗試次數: 0

剩餘嘗試次數: 不限嘗試次數

預覽不會消耗嘗試次數。

提交會記錄一次正式評分嘗試。

本單元重點詞彙