Evanalysis
8.1預計閱讀時間: 12 分鐘

8.1 特徵值、特徵向量與特徵空間

由方程 Av=λv 定義特徵值與特徵向量,再把同一個概念改寫成零空間與行列式問題,令整個結構變得可計算。

行列式會告訴你一個方陣是否可逆。特徵值問的是另一個問題:哪些向量在 矩陣作用之下仍然保持原來的方向。

大部分向量經過矩陣乘法後,方向都會被改變。特徵向量則是例外。它只會 被拉長、縮短,或者反向,而不會偏離本身張成的直線。這就是為甚麼特徵 值揭示的是矩陣的內部幾何,而不只是方程組可否解。

為甚麼這一節重要

當你解 Ax=bAx=b 時,你關心的是整個系統。當你研究特徵值時,你關心的是 那些特別的向量 v,使得矩陣作用退化成較簡單的規則

Av=λv.Av=\lambda v.

一旦找出這些向量,之後便能更容易處理矩陣的冪、理解對角化,並描述哪 些方向在變換下是不變的。

定義

特徵值與特徵向量

AA 是一個 n×nn\times n 方陣。設 λ\lambda 是一個純量,而 vRn\mathbb{R}^n 中的非零列向量。

Av=λv,Av=\lambda v,

便稱 vAA 對應於 特徵值 λ\lambda特徵向量

這裡必須要求 v 非零。因為零向量對每個純量都滿足 A0=λ0A0=\lambda0, 若把它容許進來,定義便會失去內容。

重點在於,矩陣作用與純量乘法在這個向量上完全一致。v 的方向被保 留,改變的只是長度與符號。

由定義立刻得到的結論

定理

同一個特徵向量只會對應一個特徵值

AA 是方陣,而 v 是非零向量。若

Av=λvAv=μv,Av=\lambda v \qquad\text{且}\qquad Av=\mu v,

λ=μ\lambda=\mu

原因很直接。把兩式相減:

(λμ)v=0.(\lambda-\mu)v=0.

由於 v0v\neq0,只可能是純量係數本身為 0,所以 λ=μ\lambda=\mu

定理

特徵向量的非零倍數仍是特徵向量

vAA 對應於特徵值 λ\lambda 的特徵向量,則每個非零純量倍 cv 也是 AA 的特徵向量,而且對應同一個特徵值 λ\lambda

因此,特徵向量從來不會只以單一向量出現;它自然代表一條穿過原點的 直線。

定理

同一特徵值下的線性組合

u1,,uku_1,\dots,u_k 都是 AA 的特徵向量,而且都對應同一個特徵值 λ\lambda。則每個非零線性組合

α1u1++αkuk\alpha_1u_1+\cdots+\alpha_ku_k

仍然是 AA 對應於 λ\lambda 的特徵向量。

這已經暗示:一旦把零向量加回去,對應同一個特徵值的所有特徵向量會形 成一個子空間。

第一批例子

例題

一個 2×2 矩陣有兩個不同特徵值

A=[1330614].A= \begin{bmatrix} 13&30\\ -6&-14 \end{bmatrix}.

先看向量

u1=[52].u_1= \begin{bmatrix} 5\\ -2 \end{bmatrix}.

計算得

Au1=[1330614][52]=[52]=1u1.Au_1= \begin{bmatrix} 13&30\\ -6&-14 \end{bmatrix} \begin{bmatrix} 5\\ -2 \end{bmatrix} = \begin{bmatrix} 5\\ -2 \end{bmatrix} =1\cdot u_1.

所以 u1u_1 是特徵向量,而對應特徵值為 1

再看

u2=[21].u_2= \begin{bmatrix} 2\\ -1 \end{bmatrix}.

Au2=[42]=2[21]=2u2.Au_2= \begin{bmatrix} -4\\ 2 \end{bmatrix} =-2 \begin{bmatrix} 2\\ -1 \end{bmatrix} =-2u_2.

所以 u2u_2 對應的特徵值是 2-2

例題

同一個特徵值可以對應多於一個方向

B=[211121112].B= \begin{bmatrix} 2&1&1\\ 1&2&1\\ 1&1&2 \end{bmatrix}.

向量

u1=[111]u_1= \begin{bmatrix} 1\\1\\1 \end{bmatrix}

滿足 Bu1=4u1Bu_1=4u_1,所以 4 是其中一個特徵值。

再看

u2=[110],u3=[101].u_2= \begin{bmatrix} 1\\-1\\0 \end{bmatrix}, \qquad u_3= \begin{bmatrix} 1\\0\\-1 \end{bmatrix}.

二者都滿足

Bu2=u2,Bu3=u3.Bu_2=u_2, \qquad Bu_3=u_3.

所以同一個特徵值 1 至少已有兩個線性無關的特徵向量。這並不違反前 面的唯一性定理。那條定理只說:固定一個非零向量之後,它不能同時對應 兩個不同特徵值。它沒有說:一個特徵值只會有一個方向。

特徵值其實是一個零空間問題

方程 Av=λvAv=\lambda v 若把所有項移到同一邊,便變成

Avλv=0.Av-\lambda v=0.

由於 λv=λInv\lambda v=\lambda I_nv,這等價於

(AλIn)v=0.(A-\lambda I_n)v=0.

定理

用齊次系統描述特徵值

AAn×nn\times n 矩陣,λ\lambda 是純量,而 v0v\neq0

下列兩件事等價:

  1. vAA 對應於特徵值 λ\lambda 的特徵向量。
  2. v 是齊次系統
(AλIn)x=0(A-\lambda I_n)x=0

的一個非平凡解。

於是,特徵值問題便被改寫成普通的線性系統問題。向量 v 必須落在 AλIA-\lambda I 的零空間內。

定義

特徵空間

AAn×nn\times n 矩陣,而 λ\lambdaAA 的一個特徵值。則 AA 對應於 λ\lambda特徵空間 定義為

EA(λ)=N(AλIn).E_A(\lambda)=N(A-\lambda I_n).

因此,特徵空間包含所有對應於 λ\lambda 的特徵向量,以及零向量。

因為它本身是一個零空間,所以 EA(λ)E_A(\lambda) 自動是一個子空間。

特徵值的等價刻畫

一旦有了零空間的版本,前面學過的可逆性詞典便可以直接搬過來。

定理

判斷 λ 是否為特徵值的等價條件

AAn×nn\times n 矩陣,而 λ\lambda 是純量。下列敘述等價:

  1. λ\lambdaAA 的特徵值。
  2. (AλIn)x=0(A-\lambda I_n)x=0 有非平凡解。
  3. N(AλIn){0}N(A-\lambda I_n)\neq\{0\}
  4. AλInA-\lambda I_n 不可逆。
  5. det(AλIn)=0\det(A-\lambda I_n)=0

這條定理把特徵值與行列式直接接起來,之後便會導向特徵多項式。

例題

用行化簡找特徵值與特徵空間

C=[3232].C= \begin{bmatrix} 3&2\\ 3&-2 \end{bmatrix}.

先解

det(CλI)=0.\det(C-\lambda I)=0.

得到

det[3λ232λ]=(3λ)(2λ)6=λ2λ12.\det \begin{bmatrix} 3-\lambda&2\\ 3&-2-\lambda \end{bmatrix} =(3-\lambda)(-2-\lambda)-6 =\lambda^2-\lambda-12.

因此特徵值為

λ=4,λ=3.\lambda=4,\qquad \lambda=-3.

λ=4\lambda=4

C4I=[1236][1200].C-4I= \begin{bmatrix} -1&2\\ 3&-6 \end{bmatrix} \sim \begin{bmatrix} 1&-2\\ 0&0 \end{bmatrix}.

所以 x1=2x2x_1=2x_2,可取一組基為

[21].\begin{bmatrix} 2\\1 \end{bmatrix}.

λ=3\lambda=-3

C+3I=[6231][3100].C+3I= \begin{bmatrix} 6&2\\ 3&1 \end{bmatrix} \sim \begin{bmatrix} 3&1\\ 0&0 \end{bmatrix}.

所以 3x1+x2=03x_1+x_2=0,可取一組基為

[13].\begin{bmatrix} 1\\-3 \end{bmatrix}.

因此

EC(4)=span{[21]},EC(3)=span{[13]}.E_C(4)=\operatorname{span}\left\{ \begin{bmatrix} 2\\1 \end{bmatrix} \right\}, \qquad E_C(-3)=\operatorname{span}\left\{ \begin{bmatrix} 1\\-3 \end{bmatrix} \right\}.

重要性質

定理

0 是否為特徵值,正好等同於可逆與否

對方陣 AA,下列兩件事等價:

  1. 0AA 的特徵值。
  2. AA 不可逆。

等價地,AA 可逆當且僅當 0 不是它的特徵值。

這其實只是把前面的等價條件代入 λ=0\lambda=0

定理

簡單矩陣運算下的特徵值變化

λ\lambdaAA 的特徵值,則:

  1. kλk\lambdakA 的特徵值;
  2. 對每個非負整數 mλm\lambda^mAmA^m 的特徵值;
  3. λ\lambda 也是 ATA^T 的特徵值;
  4. AA 可逆,則 λ1\lambda^{-1}A1A^{-1} 的特徵值。

這些性質都不神秘。它們只是把相應的矩陣運算直接套在方程 Av=λvAv=\lambda v 上。

常見錯誤

常見錯誤

零向量永遠不是特徵向量

學生常會留意到 A0=λ0A0=\lambda0 對所有純量都成立,於是誤以為零向量是所 有特徵值的特徵向量。正因如此,定義才必須排除零向量。特徵向量代表的 是某個真正的方向,而零向量沒有方向可言。

快速檢查

快速檢查

vAA 對應於特徵值 λ\lambda 的特徵向量,則 3v 也是嗎?

假設 v0v\neq0

解答

答案

快速檢查

為甚麼 0 是特徵值會迫使 AA 不可逆?

利用系統 (A0I)x=0(A-0I)x=0 去理解。

解答

答案

快速檢查

用零空間語言寫出 EA(λ)E_A(\lambda)

直接使用剛才的定義。

解答

答案

練習

快速檢查

證明 [11]\begin{bmatrix}1\\1\end{bmatrix}[2112]\begin{bmatrix}2&1\\1&2\end{bmatrix} 的特徵向量,並找出其特徵值。

先做矩陣乘法,再與原向量比較。

解答

引導解答

快速檢查

A=[1004]A=\begin{bmatrix}1&0\\0&4\end{bmatrix} 對應於特徵值 4 的特徵空間。

(A4I)x=0(A-4I)x=0

解答

引導解答

快速檢查

AA 可逆,則 0 會否成為 ATA^T 的特徵值?

把轉置性質與可逆性判準合起來想。

解答

引導解答

相關筆記

請把 7.2 行變換、乘積與可逆性 放在旁邊,因為測試 det(AλI)=0\det(A-\lambda I)=0 直接依賴行列式與可逆性的理 解。

接着可讀 8.2 對角化與相似, 看看一整組特徵向量如何改變矩陣的整體形狀。

本節的子空間觀點也依賴 6.5 基底與維數

本節掌握 checkpoint

要完成這一節 checkpoint,需要把每一題答對。 答對進度: 0%.

技能點: eigenvalue, invertibility, determinant

下列哪一項與「0 是方陣 A 的一個特徵值」等價?

已用嘗試次數: 0

剩餘嘗試次數: 不限嘗試次數

預覽不會消耗嘗試次數。

提交會記錄一次正式評分嘗試。

本單元重點詞彙