單一個特徵向量已經有用;若有整組可形成基底的特徵向量,情況就會徹底
改變。
若一個方陣擁有足夠多線性無關的特徵向量,就可以找到一個座標系,使它
在該座標系下變成對角矩陣。到那時候,矩陣的冪、逆矩陣與不少結構問題
都會變得幾乎不需要計算。
為甚麼對角化重要
設一個矩陣作用於 Rn。在標準基底下,這個作用可能很複
雜,因為不同坐標會互相混合。若改用由特徵向量組成的新基底,則矩陣對
每個基向量的作用就只剩下純量乘法。
而對角矩陣正正就是這樣工作的。
定義
相似
兩個 n×n 矩陣 A 與 B 若存在可逆矩陣 S 使得
S−1AS=B,便稱 A 與 B 相似。
相似的意思,是 A 與 B 其實代表同一個線性變換,只不過採用了不
同基底。
定義
對角化與可對角化
設 A 是 n×n 矩陣。
若存在可逆矩陣 S 與純量 λ1,…,λn 使得
S−1AS=diag(λ1,…,λn),則稱 A 可對角化,而上述等式稱為 A 的一個 對角化。
因此,對角化只是相似的一個特別情況:目標矩陣剛好是對角矩陣。
特徵向量正是對角化矩陣的列
定理
對角化的刻畫
設 A 是 n×n 矩陣,並令
S=[v1 v2 ⋯ vn]是一個由列向量 v1,…,vn 組成的可逆矩陣。
下列敘述等價:
- 每個 vj 都是 A 的特徵向量,而對應特徵值為 λj;
S−1AS=diag(λ1,…,λn)
這條定理是對角化的核心。換基矩陣的列並不是隨便挑的,它們必須是特徵
向量。
等價地,若記 D=diag(λ1,…,λn),
則
AS=SD.
這條式子的意思是:
AS 的第一列是 Av1,而 SD 的第一列是 λ1v1;
AS 的第二列是 Av2,而 SD 的第二列是 λ2v2;
- 其餘各列同理。
所以單一條矩陣等式 AS=SD,其實一次過包住了所有特徵向量方程。
定理
甚麼時候矩陣可對角化
n×n 矩陣 A 可對角化,當且僅當它擁有 n 個線性無關的特徵
向量。
這條判準才是你應該記住的版本。對角化不是靠運氣猜一個矩陣 S,而
是要找出一整組能形成基底的特徵向量。
第一批對角化例子
例題
一個可對角化的上三角矩陣
令
A=100120123.假設已知它有特徵向量
u1=100,u2=110,u3=342,分別對應特徵值 1、2、3。
若令
U=[u1 u2 u3],則三個向量線性無關,所以 U 可逆。因此
U−1AU=diag(1,2,3).原矩陣本身並不是對角矩陣,但在特徵向量基底下,它就變成對角矩陣。
例題
一個不可對角化的矩陣
考慮
J=[1041].它的唯一特徵值是 1,因為
det(J−λI)=1−λ041−λ=(1−λ)2.現在求 (J−I)x=0:
J−I=[0040].所以 x2=0,x1 自由。其特徵空間為
span{[10]},只有一維。對 2×2 矩陣來說,要可對角化便必須有兩個線性無關的
特徵向量,所以 J 不可對角化。
相似矩陣會保留特徵值資料
相似不是任意的共軛操作;它會保留矩陣的核心特徵值結構。
定理
相似矩陣有相同特徵多項式
若 A 與 B 相似,則
pA(x)=pB(x).特別地,A 與 B 有相同的特徵值。
這正是對角化有意義的原因。由 A 得到的對角矩陣並不是另一個無關的
光譜對象,而是同一個線性變換在另一組基底下的寫法,只不過那組基底會
把特徵值直接暴露在對角線上。
常見錯誤
特徵多項式相同,不代表一定相似
相似會推出特徵多項式相同,但反過來並不成立。兩個矩陣可以有相同特徵
多項式,卻仍然不相似。
例如
[0010]與[0000]都有特徵多項式 x2,但前者並不與零矩陣相似。
對角化令冪與逆矩陣變得容易
假設
A=SDS−1,D=diag(λ1,…,λn).
則矩陣代數會大幅簡化。
定理
可對角化矩陣的冪、逆與轉置
若 A=SDS−1 且 D 是對角矩陣,則對每個正整數 m,
Am=SDmS−1.若 A 可逆,則 D 的每個對角線項都非零,而且
A−1=SD−1S−1.另外,AT 亦可對角化,並且與 A 具有相同的特徵值。
關鍵在於對角矩陣的冪很好算:
diag(λ1,…,λn)m=diag(λ1m,…,λnm).
例題
用對角化計算矩陣冪
令
A=211121112.若已知
A=Sdiag(4,1,1)S−1,則
Am=Sdiag(4m,1,1)S−1.因此真正困難的步驟只在於把矩陣對角化一次。之後所有正整數次方都只需
把 4 改成 4m,而重複的 1 保持不變即可。
快速檢查
快速檢查
一個 3×3 矩陣若只有兩個線性無關的特徵向量,可以可對角化嗎?
快速檢查
若 A 與 D 相似,而 D 是對角矩陣,則 A 與 D 的特徵值是否相同?
練習
快速檢查
若 A 有特徵向量 v1,v2,v3,對應特徵值 2,5,−1,且三者線性無關,那在 A 的一個對角化中會出現哪個對角矩陣?
快速檢查
解釋為甚麼 [1011] 不可對角化。
快速檢查
若 A=SDS−1,而 D=diag(2,−1),求 A3。
相關筆記
若你對特徵值與零空間的關係仍未穩固,應先回看
8.1 特徵值、特徵向量與特徵空間。
接着可讀
8.3 特徵多項式與對角化測試,
因為那一節會提供判斷「是否有足夠特徵向量」的多項式工具。
本節使用的基底語言亦依賴
6.5 基底與維數。