Evanalysis
7.1预计阅读时间: 12 分钟

7.1 行列式与余因子展开

先用子式与余因子仔细定义行列式,再理解余因子展开如何把一个标量变成方阵结构的精确摘要。

行列式会为一个方阵配上一个数。这个数并不是装饰。之后它会告诉你矩 阵是否可逆、行与列变换怎样影响矩阵,以及某些方形线性系统如何用公 式解出。

代价是,行列式的定义比矩阵加法或数乘细致得多。行列式只对方阵定 义,而且它是由较小尺寸的行列式递归建出来的。

为什么这一节重要

如果你只背

det[abcd]=adbc,\det\begin{bmatrix}a&b\\c&d\end{bmatrix}=ad-bc,

你就会错过真正的结构。这一节要做的,是说明这个公式从何而来、为什 么符号会交替,以及为什么沿着一条选得好的行或列展开,可以把一个困 难计算变得可控制。

定义

子矩阵、子式与余因子

A=[aij]A=[a_{ij}] 是一个 n×nn\times n 矩阵。

固定 ij,删去第 i 行与第 j 列,得到的 (n1)×(n1)(n-1)\times(n-1) 矩阵记作 A(ij)A(i\mid j)

aija_{ij}子式 定义为

Mij=det(A(ij)).M_{ij}=\det(A(i\mid j)).

aija_{ij}余因子 定义为

Aij=(1)i+jMij.A_{ij}=(-1)^{i+j}M_{ij}.

因子 (1)i+j(-1)^{i+j} 产生棋盘式的正负号:

[+++++].\begin{bmatrix} + & - & + & \cdots\\ - & + & - & \cdots\\ + & - & + & \cdots\\ \vdots & \vdots & \vdots & \ddots \end{bmatrix}.

定义

用余因子展开定义行列式

A=[a11]A=[a_{11}]1×11\times1 矩阵,就定义

det(A)=a11.\det(A)=a_{11}.

A=[aij]A=[a_{ij}]n×nn\times n 矩阵且 n>1n>1,就沿第一行作展开:

det(A)=a11A11+a12A12++a1nA1n.\det(A)=a_{11}A_{11}+a_{12}A_{12}+\cdots+a_{1n}A_{1n}.

等价地,

det(A)=a11M11a12M12++(1)1+na1nM1n.\det(A)=a_{11}M_{11}-a_{12}M_{12}+\cdots+(-1)^{1+n}a_{1n}M_{1n}.

这个定义是递归的。4×44\times4 行列式会被拆成几个 3×33\times3 行列 式,而每个 3×33\times3 行列式又会被拆成 2×22\times2 行列式,最后再 回到 1×11\times1 的基本情况。

第一批例子

例题

熟悉的 2×2 公式其实来自定义

A=[a11a12a21a22].A=\begin{bmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{bmatrix}.

第一行的余因子是

A11=(1)1+1a22=a22,A12=(1)1+2a21=a21.A_{11}=(-1)^{1+1}a_{22}=a_{22}, \qquad A_{12}=(-1)^{1+2}a_{21}=-a_{21}.

所以

det(A)=a11A11+a12A12=a11a22a12a21.\det(A)=a_{11}A_{11}+a_{12}A_{12} =a_{11}a_{22}-a_{12}a_{21}.

因此常见的 adbcad-bc 公式并不是另一条独立定理,而是递归定义在 2×22\times2 情况下的具体写法。

例题

用余因子展开计算一个 3×3 行列式

B=[321416312].B= \begin{bmatrix} 3&2&-1\\ 4&1&6\\ -3&-1&2 \end{bmatrix}.

沿第一行展开:

det(B)=3161224632(1)4131.\det(B)=3 \begin{vmatrix} 1&6\\ -1&2 \end{vmatrix} -2 \begin{vmatrix} 4&6\\ -3&2 \end{vmatrix} (-1) \begin{vmatrix} 4&1\\ -3&-1 \end{vmatrix}.

先算三个 2×22\times2 行列式:

1612=126(1)=8,\begin{vmatrix} 1&6\\ -1&2 \end{vmatrix}=1\cdot2-6(-1)=8,4632=426(3)=26,\begin{vmatrix} 4&6\\ -3&2 \end{vmatrix}=4\cdot2-6(-3)=26,4131=4(1)1(3)=1.\begin{vmatrix} 4&1\\ -3&-1 \end{vmatrix}=4(-1)-1(-3)=-1.

因此

det(B)=3(8)2(26)+(1)(1)=2452+1=27.\det(B)=3(8)-2(26)+(-1)(-1)=24-52+1=-27.

沿着零较多的行去展开

直接展开通常很贵。余因子展开真正有用之处,在于你可以挑选一条最省 工的行或列。

定理

可沿任意一行作余因子展开

对任意固定的第 i 行,若 A=[aij]A=[a_{ij}]n×nn\times n 矩阵,则

det(A)=ai1Ai1+ai2Ai2++ainAin.\det(A)=a_{i1}A_{i1}+a_{i2}A_{i2}+\cdots+a_{in}A_{in}.

等价地,

det(A)=j=1n(1)i+jaijMij.\det(A)=\sum_{j=1}^n (-1)^{i+j}a_{ij}M_{ij}.

所以虽然定义是沿第一行写出的,但同一个行列式其实可以沿任何一行展 开。

例题

选一条可以消掉最多工作的行

C=[1977052519801983].C= \begin{bmatrix} 1&9&7&7\\ 0&5&2&5\\ 1&9&8&0\\ 1&9&8&3 \end{bmatrix}.

沿第二行展开比沿第一行展开更好,因为第二行第一项本身已经是 0

det(C)=0A21+5A22+2A23+5A24.\det(C)= 0\cdot A_{21} +5A_{22} +2A_{23} +5A_{24}.

这样只剩三个 3×33\times3 行列式,而不是四个。实际计算时,最好的那 条行或列通常就是零最多、或者数字最简单的那一条。

从定义直接得到的快结论

只要允许你沿适当的行或列展开,不少实用定理都会立即出现。

定理

有零行或零列,行列式就是 0

若一个方阵有一整行都是 0,则其行列式等于 0。同样地,若它有一 整列都是 0,行列式也等于 0

零行的说法是立刻可见的:直接沿那一行展开即可。零列的说法则是同一 个结构从列的角度再看一次。

定理

某行或某列只有一个非零项时,可以立刻缩小尺寸

若方阵 CC 的第 k 行最多只有一个非零项,而该项位于 (k,)(k,\ell), 则

det(C)=ck(1)k+det(C(k)).\det(C)=c_{k\ell}(-1)^{k+\ell}\det(C(k\mid \ell)).

若第 \ell 列最多只有一个非零项,而且该非零项位于第 k 行,也有 同样的结论。

这条定理正式表达了初学者常用的直觉:若某行或某列几乎全是零,就应 该立即利用它。

定理

三角矩阵的行列式很容易读

TT 是上三角或下三角矩阵,则

det(T)=t11t22tnn,\det(T)=t_{11}t_{22}\cdots t_{nn},

也就是对角线各项的乘积。

这就是之后我们如此重视行化简的原因。若你能把矩阵化到三角形,同时 又准确记录行列式怎样改变,那最终的值就会很容易读出。

例题

三角矩阵只需看对角线

T=[234057001],T= \begin{bmatrix} 2&3&4\\ 0&5&7\\ 0&0&-1 \end{bmatrix},

不需要做完整展开。因为 TT 是上三角矩阵,

det(T)=25(1)=10.\det(T)=2\cdot5\cdot(-1)=-10.

对角线以上的数字对矩阵本身当然重要,但在这种三角情况下,它们不会 影响行列式公式。

多重线性与交替性

行列式并不是对整个矩阵一次性线性的,但若把其他各行固定,它对其中 一行是线性的。

定理

固定其他各行后,行列式对某一行是线性的

固定某个方阵除了第 p 行以外的所有行。若新的第 p 行是

αu+βv,\alpha u+\beta v,

那么行列式便会拆成

det(相同其他各行,但第 p 行是 αu+βv)=αdet(相同其他各行,但第 p 行是 u)+βdet(相同其他各行,但第 p 行是 v).\det(\text{相同其他各行,但第 p 行是 }\alpha u+\beta v) =\alpha\det(\text{相同其他各行,但第 p 行是 }u) +\beta\det(\text{相同其他各行,但第 p 行是 }v).

所以行列式是对每一行分别线性的。

定理

若有两行相同,行列式必为 0

若一个方阵有两行完全相同,则它的行列式等于 0

这件事揭示了行列式衡量的是独立性,而不只是大小。若你重复了一行, 矩阵便没有提供新的方向,带符号面积或带符号体积就会塌缩。

证明

为什么重复的两行会逼出 0

常见错误

常见错误

行列式只属于方阵

很多人会不自觉地问一个 2×32\times33×23\times2 矩阵的行列式是什 么。不要这样做。行列式只对方阵定义,因为递归的子式构造必须每次都 从一个方阵删去一行一列,并且仍然保持是方阵。

快速检查

快速检查

det[4]\det\begin{bmatrix}4\end{bmatrix} 是多少?

回想递归定义的基本情况。

解答

答案

快速检查

为什么沿着零较多的行去展开会比较聪明?

想想展开式中会剩下多少个非零项。

解答

答案

快速检查

若一个对角矩阵的对角线项是 21-15,它的行列式是多少?

用三角矩阵公式。

解答

答案

练习

快速检查

用余因子定义计算 det[1234]\det\begin{bmatrix}1&2\\3&4\end{bmatrix}

先把第一行的两个余因子写出来,再代回去。

解答

引导解答

快速检查

用最合适的行或列展开,求 det[201030405]\det\begin{bmatrix}2&0&1\\0&3&0\\4&0&5\end{bmatrix}

先找零最多的一行或一列。

解答

引导解答

快速检查

解释为什么有一条零行的矩阵不可能可逆。

把本节结论与下一节的可逆性判准连起来。

解答

引导解答

相关笔记

可先回到 2.1 矩阵基础 复习方阵与索引记号。

接着读 7.2 行变换、乘积与可逆性, 看看行列式如何与消元法接上。

也可把 5.1 可逆矩阵 一并放在旁边,因为之后行列式会成为另一个可逆性判准。

本节掌握 checkpoint

要完成这一节 checkpoint,需要把每一题答对。 答对进度: 0%.

技能点: determinant, triangular-matrix, cofactor-expansion

若 A 是一个 4×4 上三角矩阵,其对角线项为 2、-3、5、7,det(A) 是多少?

已用尝试次数: 0

剩余尝试次数: 不限尝试次数

预览不会消耗尝试次数。

提交会记录一次正式评分尝试。

本单元重点词汇