矩阵代数 (Matrix Algebra)
矩阵代数 (Matrix Algebra)是研究矩阵及其运算规则的数学分支,构成了线性代数 的核心计算框架。在经济学与计量经济学 中,矩阵代数是处理多变量系统、线性方程组、最优化问题和统计分析的基础语言。一个 m × n m \times n m × n 矩阵 A \mathbf{A} A 是由 m m m 行、n n n 列元素排列而成的矩形数组,记作 A = [ a i j ] m × n \mathbf{A} = [a_{ij}]_{m \times n} A = [ a ij ] m × n 。
基本运算
矩阵的基本运算包括加法、标量乘法、矩阵乘法与转置。
矩阵加法要求两矩阵同型(行数列数相同),按元素逐项相加:若 C = A + B \mathbf{C} = \mathbf{A} + \mathbf{B} C = A + B ,则 c i j = a i j + b i j c_{ij} = a_{ij} + b_{ij} c ij = a ij + b ij 。加法满足交换律与结合律。
矩阵乘法中,A m × n \mathbf{A}_{m \times n} A m × n 与 B n × p \mathbf{B}_{n \times p} B n × p 的乘积 C = A B \mathbf{C} = \mathbf{A}\mathbf{B} C = AB 是一个 m × p m \times p m × p 矩阵,其中 c i j = ∑ k = 1 n a i k b k j c_{ij} = \sum_{k=1}^{n} a_{ik} b_{kj} c ij = ∑ k = 1 n a ik b kj 。矩阵乘法不满足交换律(一般 A B ≠ B A \mathbf{A}\mathbf{B} \neq \mathbf{B}\mathbf{A} AB = BA ),但满足结合律与分配律。
转置运算将矩阵的行与列互换:A ′ \mathbf{A}' A ′ 或 A ⊤ \mathbf{A}^{\top} A ⊤ 满足 a i j ′ = a j i a'_{ij} = a_{ji} a ij ′ = a ji 。转置满足 ( A B ) ′ = B ′ A ′ (\mathbf{A}\mathbf{B})' = \mathbf{B}'\mathbf{A}' ( AB ) ′ = B ′ A ′ 。
特殊矩阵
在经济计量模型中,几类特殊矩阵尤为重要:
方阵 (Square Matrix):行数等于列数。方阵有行列式、逆矩阵、特征值等独特性质。对称矩阵 :A = A ′ \mathbf{A} = \mathbf{A}' A = A ′ 。协方差矩阵 、海森矩阵 均为对称矩阵。幂等矩阵 :A 2 = A \mathbf{A}^2 = \mathbf{A} A 2 = A 。投影矩阵是典型的幂等矩阵,在 OLS 中有核心应用。正定矩阵 :对任意非零向量 x \mathbf{x} x ,二次型 x ′ A x > 0 \mathbf{x}'\mathbf{A}\mathbf{x} > 0 x ′ Ax > 0 。协方差矩阵、信息矩阵必须为正定。对角矩阵 :非对角线元素全为零。单位矩阵 I \mathbf{I} I (对角线全为 1)在矩阵代数中充当乘法单位元。
逆矩阵与线性方程组
对 n × n n \times n n × n 方阵 A \mathbf{A} A ,若存在 A − 1 \mathbf{A}^{-1} A − 1 使得 A A − 1 = A − 1 A = I \mathbf{A}\mathbf{A}^{-1} = \mathbf{A}^{-1}\mathbf{A} = \mathbf{I} A A − 1 = A − 1 A = I ,则称 A \mathbf{A} A 可逆(非奇异)。逆矩阵的性质包括 ( A − 1 ) − 1 = A (\mathbf{A}^{-1})^{-1} = \mathbf{A} ( A − 1 ) − 1 = A 、( A B ) − 1 = B − 1 A − 1 (\mathbf{A}\mathbf{B})^{-1} = \mathbf{B}^{-1}\mathbf{A}^{-1} ( AB ) − 1 = B − 1 A − 1 以及 ( A ′ ) − 1 = ( A − 1 ) ′ (\mathbf{A}')^{-1} = (\mathbf{A}^{-1})' ( A ′ ) − 1 = ( A − 1 ) ′ 。
线性方程组 A x = b \mathbf{A}\mathbf{x} = \mathbf{b} Ax = b 当 A \mathbf{A} A 可逆时有唯一解 x = A − 1 b \mathbf{x} = \mathbf{A}^{-1}\mathbf{b} x = A − 1 b 。在计量经济学中,OLS 估计量 β ^ = ( X ′ X ) − 1 X ′ y \hat{\boldsymbol{\beta}} = (\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{y} β ^ = ( X ′ X ) − 1 X ′ y 正是这一形式的直接应用——其中 ( X ′ X ) (\mathbf{X}'\mathbf{X}) ( X ′ X ) 的求逆是估计过程的核心步骤。
秩、迹与行列式
矩阵的秩 定义为其线性无关的行(或列)的最大数目,记为 rank ( A ) \operatorname{rank}(\mathbf{A}) rank ( A ) 。满秩方阵可逆;降秩则意味列之间存在线性依赖,对应于多重共线性 问题。秩满足 rank ( A B ) ≤ min ( rank ( A ) , rank ( B ) ) \operatorname{rank}(\mathbf{A}\mathbf{B}) \leq \min(\operatorname{rank}(\mathbf{A}), \operatorname{rank}(\mathbf{B})) rank ( AB ) ≤ min ( rank ( A ) , rank ( B )) 。
迹 是方阵对角线元素之和:tr ( A ) = ∑ i a i i \operatorname{tr}(\mathbf{A}) = \sum_{i} a_{ii} tr ( A ) = ∑ i a ii 。迹满足循环不变性:tr ( A B ) = tr ( B A ) \operatorname{tr}(\mathbf{A}\mathbf{B}) = \operatorname{tr}(\mathbf{B}\mathbf{A}) tr ( AB ) = tr ( BA ) ,在推导Frisch-Waugh-Lovell 定理 和方差分解中频繁使用。
行列式 det ( A ) \det(\mathbf{A}) det ( A ) 反映矩阵缩放体积的因子,可逆等价于 det ( A ) ≠ 0 \det(\mathbf{A}) \neq 0 det ( A ) = 0 。行列式满足乘积性质 det ( A B ) = det ( A ) det ( B ) \det(\mathbf{A}\mathbf{B}) = \det(\mathbf{A})\det(\mathbf{B}) det ( AB ) = det ( A ) det ( B ) 。
特征值与对角化
若 A v = λ v \mathbf{A}\mathbf{v} = \lambda \mathbf{v} Av = λ v (v ≠ 0 \mathbf{v} \neq \mathbf{0} v = 0 ),则 λ \lambda λ 为 A \mathbf{A} A 的特征值,v \mathbf{v} v 为对应特征向量。对称矩阵的特征值均为实数且特征向量正交。谱分解 A = Q Λ Q ′ \mathbf{A} = \mathbf{Q}\boldsymbol{\Lambda}\mathbf{Q}' A = Q Λ Q ′ (Q \mathbf{Q} Q 正交,Λ \boldsymbol{\Lambda} Λ 对角)将矩阵表示为其特征系统,在主成分分析 (PCA)和协方差矩阵 估计中至关重要。
分块矩阵与求逆公式
在涉及多组变量的模型中,分块矩阵运算至关重要。将矩阵 A \mathbf{A} A 按行列分割为子块后,其逆矩阵可通过分块求逆公式获得:
[ A 11 A 12 A 21 A 22 ] − 1 \begin{bmatrix}
\mathbf{A}_{11} & \mathbf{A}_{12} \\
\mathbf{A}_{21} & \mathbf{A}_{22}
\end{bmatrix}^{-1} [ A 11 A 21 A 12 A 22 ] − 1
=
\begin{bmatrix}
\(\mathbf{F}^{-1}\) \& -\(\mathbf{F}^{-1}\)\(\mathbf{A}_{12}\)\(\mathbf{A}_{22}^{-1}\) \\
-\(\mathbf{A}_{22}^{-1}\)\(\mathbf{A}_{21}\)\(\mathbf{F}^{-1}\) \& \(\mathbf{A}_{22}^{-1}\) + \(\mathbf{A}_{22}^{-1}\)\(\mathbf{A}_{21}\)\(\mathbf{F}^{-1}\)\(\mathbf{A}_{12}\)\(\mathbf{A}_{22}^{-1}\)
\[
\end{bmatrix}
\]
其中 F = A 11 − A 12 A 22 − 1 A 21 \mathbf{F} = \mathbf{A}_{11} - \mathbf{A}_{12}\mathbf{A}_{22}^{-1}\mathbf{A}_{21} F = A 11 − A 12 A 22 − 1 A 21 称为 A 22 \mathbf{A}_{22} A 22 的舒尔补。该公式在推导 OLS 估计量的条件方差、计算偏相关系数及\wiki F r i s c h − W a u g h − L o v e l l 定理 \wiki{Frisch-Waugh-Lovell 定理} \wiki F r i sc h − Wa ug h − L o v e ll 定理 的证明中起关键作用。
Kronecker 积与 Vec 算子
Kronecker 积 A ⊗ B \mathbf{A} \otimes \mathbf{B} A ⊗ B 将 m × n m \times n m × n 矩阵 A \mathbf{A} A 与 p × q p \times q p × q 矩阵 B \mathbf{B} B 映射为 m p × n q mp \times nq m p × n q 分块矩阵,其中第 ( i , j ) (i,j) ( i , j ) 块为 a i j B a_{ij}\mathbf{B} a ij B 。Kronecker 积的核心性质包括混合乘积 ( A ⊗ B ) ( C ⊗ D ) = A C ⊗ B D (\mathbf{A} \otimes \mathbf{B})(\mathbf{C} \otimes \mathbf{D}) = \mathbf{A}\mathbf{C} \otimes \mathbf{B}\mathbf{D} ( A ⊗ B ) ( C ⊗ D ) = AC ⊗ BD 、转置 ( A ⊗ B ) ′ = A ′ ⊗ B ′ (\mathbf{A} \otimes \mathbf{B})' = \mathbf{A}' \otimes \mathbf{B}' ( A ⊗ B ) ′ = A ′ ⊗ B ′ 以及逆 ( A ⊗ B ) − 1 = A − 1 ⊗ B − 1 (\mathbf{A} \otimes \mathbf{B})^{-1} = \mathbf{A}^{-1} \otimes \mathbf{B}^{-1} ( A ⊗ B ) − 1 = A − 1 ⊗ B − 1 (当 A , B \mathbf{A},\mathbf{B} A , B 可逆)。
Vec 算子将矩阵按列堆叠为向量:vec ( A ) = [ a 1 ′ , a 2 ′ , … , a n ′ ] ′ \operatorname{vec}(\mathbf{A}) = [\mathbf{a}_1', \mathbf{a}_2', \ldots, \mathbf{a}_n']' vec ( A ) = [ a 1 ′ , a 2 ′ , … , a n ′ ] ′ 。两者由恒等式 vec ( A B C ) = ( C ′ ⊗ A ) vec ( B ) \operatorname{vec}(\mathbf{A}\mathbf{B}\mathbf{C}) = (\mathbf{C}' \otimes \mathbf{A})\operatorname{vec}(\mathbf{B}) vec ( ABC ) = ( C ′ ⊗ A ) vec ( B ) 关联,该关系在推导\wiki 似然方程 \wiki{似然方程} \wiki 似然方程 、\wiki 广义最小二乘法 \wiki{广义最小二乘法} \wiki 广义最小二乘法 中协方差结构估计以及\wiki 联立方程模型 \wiki{联立方程模型} \wiki 联立方程模型 的向量化处理中不可或缺。
二次型与矩阵微积分
二次型 x ′ A x = ∑ i ∑ j a i j x i x j \mathbf{x}'\mathbf{A}\mathbf{x} = \sum_i \sum_j a_{ij} x_i x_j x ′ Ax = ∑ i ∑ j a ij x i x j 是标量函数的最常见矩阵表达。对称化后 A \mathbf{A} A 可令其唯一:x ′ A x = x ′ ( ( A + A ′ ) / 2 ) x \mathbf{x}'\mathbf{A}\mathbf{x} = \mathbf{x}'((\mathbf{A} + \mathbf{A}')/2)\mathbf{x} x ′ Ax = x ′ (( A + A ′ ) /2 ) x 。OLS 残差平方和 ϵ ^ ′ ϵ ^ \hat{\boldsymbol{\epsilon}}'\hat{\boldsymbol{\epsilon}} ϵ ^ ′ ϵ ^ 即为二次型。矩阵求导规则使极值问题的处理系统化:∂ ( a ′ x ) / ∂ x = a \partial(\mathbf{a}'\mathbf{x})/\partial\mathbf{x} = \mathbf{a} ∂ ( a ′ x ) / ∂ x = a 、∂ ( x ′ A x ) / ∂ x = ( A + A ′ ) x \partial(\mathbf{x}'\mathbf{A}\mathbf{x})/\partial\mathbf{x} = (\mathbf{A} + \mathbf{A}')\mathbf{x} ∂ ( x ′ Ax ) / ∂ x = ( A + A ′ ) x (对称 A \mathbf{A} A 时为 2 A x 2\mathbf{A}\mathbf{x} 2 Ax )、∂ ( log ∣ A ∣ ) / ∂ A = ( A − 1 ) ′ \partial(\log|\mathbf{A}|)/\partial\mathbf{A} = (\mathbf{A}^{-1})' ∂ ( log ∣ A ∣ ) / ∂ A = ( A − 1 ) ′ 。这些规则在极大似然估计中推导得分函数与\wiki F i s h e r 信息矩阵 \wiki{Fisher 信息矩阵} \wiki F i s h er 信息矩阵 时不可或缺。
计量经济学中的应用
矩阵代数为计量经济学提供了紧凑而强大的记法和推导工具。多元线性回归 y = X β + ϵ \mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \boldsymbol{\epsilon} y = X β + ϵ 的 OLS 目标函数可写作 min β ( y − X β ) ′ ( y − X β ) \min_{\boldsymbol{\beta}} (\mathbf{y} - \mathbf{X}\boldsymbol{\beta})'(\mathbf{y} - \mathbf{X}\boldsymbol{\beta}) min β ( y − X β ) ′ ( y − X β ) ,一阶条件即为正规方程 X ′ X β ^ = X ′ y \mathbf{X}'\mathbf{X}\hat{\boldsymbol{\beta}} = \mathbf{X}'\mathbf{y} X ′ X β ^ = X ′ y 。残差平方和可用投影矩阵 M = I − X ( X ′ X ) − 1 X ′ \mathbf{M} = \mathbf{I} - \mathbf{X}(\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}' M = I − X ( X ′ X ) − 1 X ′ 表达为 ϵ ^ ′ ϵ ^ = y ′ M y \hat{\boldsymbol{\epsilon}}'\hat{\boldsymbol{\epsilon}} = \mathbf{y}'\mathbf{M}\mathbf{y} ϵ ^ ′ ϵ ^ = y ′ My ,方差-协方差矩阵为 Var ( β ^ ) = σ 2 ( X ′ X ) − 1 \operatorname{Var}(\hat{\boldsymbol{\beta}}) = \sigma^2(\mathbf{X}'\mathbf{X})^{-1} Var ( β ^ ) = σ 2 ( X ′ X ) − 1 。矩阵求导规则(如 ∂ ( a ′ x ) / ∂ x = a \partial(\mathbf{a}'\mathbf{x})/\partial\mathbf{x} = \mathbf{a} ∂ ( a ′ x ) / ∂ x = a 、∂ ( x ′ A x ) / ∂ x = 2 A x \partial(\mathbf{x}'\mathbf{A}\mathbf{x})/\partial\mathbf{x} = 2\mathbf{A}\mathbf{x} ∂ ( x ′ Ax ) / ∂ x = 2 Ax 对对称 A \mathbf{A} A )极大简化了一阶条件的推导。理解矩阵代数是深入学习广义最小二乘法 、工具变量 估计、联立方程模型 等高级主题的必要前提。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。