行列式會告訴你一個方陣是否可逆。特徵值問的是另一個問題:哪些向量在
矩陣作用之下仍然保持原來的方向。
大部分向量經過矩陣乘法後,方向都會被改變。特徵向量則是例外。它只會
被拉長、縮短,或者反向,而不會偏離本身張成的直線。這就是為甚麼特徵
值揭示的是矩陣的內部幾何,而不只是方程組可否解。
為甚麼這一節重要
當你解 Ax=b 時,你關心的是整個系統。當你研究特徵值時,你關心的是
那些特別的向量 v,使得矩陣作用退化成較簡單的規則
Av=λv.
一旦找出這些向量,之後便能更容易處理矩陣的冪、理解對角化,並描述哪
些方向在變換下是不變的。
定義
特徵值與特徵向量
設 A 是一個 n×n 方陣。設 λ 是一個純量,而 v 是
Rn 中的非零列向量。
若
Av=λv,便稱 v 是 A 對應於 特徵值 λ 的 特徵向量。
這裡必須要求 v 非零。因為零向量對每個純量都滿足 A0=λ0,
若把它容許進來,定義便會失去內容。
重點在於,矩陣作用與純量乘法在這個向量上完全一致。v 的方向被保
留,改變的只是長度與符號。
由定義立刻得到的結論
定理
同一個特徵向量只會對應一個特徵值
設 A 是方陣,而 v 是非零向量。若
Av=λv且Av=μv,則 λ=μ。
原因很直接。把兩式相減:
(λ−μ)v=0.
由於 v=0,只可能是純量係數本身為 0,所以 λ=μ。
定理
特徵向量的非零倍數仍是特徵向量
若 v 是 A 對應於特徵值 λ 的特徵向量,則每個非零純量倍
cv 也是 A 的特徵向量,而且對應同一個特徵值 λ。
因此,特徵向量從來不會只以單一向量出現;它自然代表一條穿過原點的
直線。
定理
同一特徵值下的線性組合
設 u1,…,uk 都是 A 的特徵向量,而且都對應同一個特徵值
λ。則每個非零線性組合
α1u1+⋯+αkuk仍然是 A 對應於 λ 的特徵向量。
這已經暗示:一旦把零向量加回去,對應同一個特徵值的所有特徵向量會形
成一個子空間。
第一批例子
例題
一個 2×2 矩陣有兩個不同特徵值
令
A=[13−630−14].先看向量
u1=[5−2].計算得
Au1=[13−630−14][5−2]=[5−2]=1⋅u1.所以 u1 是特徵向量,而對應特徵值為 1。
再看
u2=[2−1].則
Au2=[−42]=−2[2−1]=−2u2.所以 u2 對應的特徵值是 −2。
例題
同一個特徵值可以對應多於一個方向
令
B=211121112.向量
u1=111滿足 Bu1=4u1,所以 4 是其中一個特徵值。
再看
u2=1−10,u3=10−1.二者都滿足
Bu2=u2,Bu3=u3.所以同一個特徵值 1 至少已有兩個線性無關的特徵向量。這並不違反前
面的唯一性定理。那條定理只說:固定一個非零向量之後,它不能同時對應
兩個不同特徵值。它沒有說:一個特徵值只會有一個方向。
特徵值其實是一個零空間問題
方程 Av=λv 若把所有項移到同一邊,便變成
Av−λv=0.
由於 λv=λInv,這等價於
(A−λIn)v=0.
定理
用齊次系統描述特徵值
設 A 是 n×n 矩陣,λ 是純量,而 v=0。
下列兩件事等價:
v 是 A 對應於特徵值 λ 的特徵向量。
v 是齊次系統
(A−λIn)x=0的一個非平凡解。
於是,特徵值問題便被改寫成普通的線性系統問題。向量 v 必須落在
A−λI 的零空間內。
定義
特徵空間
設 A 是 n×n 矩陣,而 λ 是 A 的一個特徵值。則
A 對應於 λ 的 特徵空間 定義為
EA(λ)=N(A−λIn).因此,特徵空間包含所有對應於 λ 的特徵向量,以及零向量。
因為它本身是一個零空間,所以 EA(λ) 自動是一個子空間。
特徵值的等價刻畫
一旦有了零空間的版本,前面學過的可逆性詞典便可以直接搬過來。
定理
判斷 λ 是否為特徵值的等價條件
設 A 是 n×n 矩陣,而 λ 是純量。下列敘述等價:
- λ 是 A 的特徵值。
- (A−λIn)x=0 有非平凡解。
- N(A−λIn)={0}。
- A−λIn 不可逆。
- det(A−λIn)=0。
這條定理把特徵值與行列式直接接起來,之後便會導向特徵多項式。
例題
用行化簡找特徵值與特徵空間
令
C=[332−2].先解
det(C−λI)=0.得到
det[3−λ32−2−λ]=(3−λ)(−2−λ)−6=λ2−λ−12.因此特徵值為
λ=4,λ=−3.對 λ=4,
C−4I=[−132−6]∼[10−20].所以 x1=2x2,可取一組基為
[21].對 λ=−3,
C+3I=[6321]∼[3010].所以 3x1+x2=0,可取一組基為
[1−3].因此
EC(4)=span{[21]},EC(−3)=span{[1−3]}.
重要性質
定理
0 是否為特徵值,正好等同於可逆與否
對方陣 A,下列兩件事等價:
0 是 A 的特徵值。
- A 不可逆。
等價地,A 可逆當且僅當 0 不是它的特徵值。
這其實只是把前面的等價條件代入 λ=0。
定理
簡單矩陣運算下的特徵值變化
若 λ 是 A 的特徵值,則:
- kλ 是
kA 的特徵值;
- 對每個非負整數
m,λm 是 Am 的特徵值;
- λ 也是 AT 的特徵值;
- 若 A 可逆,則 λ−1 是 A−1 的特徵值。
這些性質都不神秘。它們只是把相應的矩陣運算直接套在方程 Av=λv 上。
常見錯誤
常見錯誤
零向量永遠不是特徵向量
學生常會留意到 A0=λ0 對所有純量都成立,於是誤以為零向量是所
有特徵值的特徵向量。正因如此,定義才必須排除零向量。特徵向量代表的
是某個真正的方向,而零向量沒有方向可言。
快速檢查
快速檢查
若 v 是 A 對應於特徵值 λ 的特徵向量,則 3v 也是嗎?
快速檢查
為甚麼 0 是特徵值會迫使 A 不可逆?
利用系統 (A−0I)x=0 去理解。
快速檢查
用零空間語言寫出 EA(λ)。
練習
快速檢查
證明 [11] 是 [2112] 的特徵向量,並找出其特徵值。
快速檢查
求 A=[1004] 對應於特徵值 4 的特徵空間。
解 (A−4I)x=0。
快速檢查
若 A 可逆,則 0 會否成為 AT 的特徵值?
相關筆記
請把
7.2 行變換、乘積與可逆性
放在旁邊,因為測試 det(A−λI)=0 直接依賴行列式與可逆性的理
解。
接着可讀
8.2 對角化與相似,
看看一整組特徵向量如何改變矩陣的整體形狀。
本節的子空間觀點也依賴
6.5 基底與維數。