ARTICLE

系数矩阵

系数矩阵 (Coefficient Matrix) 系数矩阵(Coefficient Matrix)是将线性方程组中所有未知量的系数按原有位置提取出来所构成的矩阵。它是线性代数中最基本的矩阵构造之一,也是连接线性方程组与矩阵理论的桥梁。对于含有 m 个方程、n 个未知量的线性方程组: 其系数矩阵 A 是一个 m n 矩阵: a_11 \& a_12 \& \

浏览 0 更新 2025-12-09

系数矩阵 (Coefficient Matrix)

系数矩阵(Coefficient Matrix)是将线性方程组中所有未知量的系数按原有位置提取出来所构成的矩阵。它是线性代数中最基本的矩阵构造之一,也是连接线性方程组与矩阵理论的桥梁。对于含有 mm 个方程、nn 个未知量的线性方程组:

{a11x1+a12x2++a1nxn=b1a21x1+a22x2++a2nxn=b2am1x1+am2x2++amnxn=bm\begin{cases} a_{11}x_1 + a_{12}x_2 + \cdots + a_{1n}x_n = b_1 \\ a_{21}x_1 + a_{22}x_2 + \cdots + a_{2n}x_n = b_2 \\ \quad \vdots \\ a_{m1}x_1 + a_{m2}x_2 + \cdots + a_{mn}x_n = b_m \end{cases}

其系数矩阵 AA 是一个 m×nm \times n 矩阵:

A = \begin{pmatrix}

a11a_{11} \& a12a_{12} \& \cdots \& a1na_{1n} \\ a21a_{21} \& a22a_{22} \& \cdots \& a2na_{2n} \\ \vdots \& \vdots \& \ddots \& \vdots \\ am1a_{m1} \& am2a_{m2} \& \cdots \& amna_{mn}

\end{pmatrix}

将系数矩阵 AA 与常数项列向量 b=(b1,b2,,bm)\mathbf{b} = (b_1, b_2, \ldots, b_m)^\top 横向拼接,得到的 m×(n+1)m \times (n+1) 矩阵称为增广矩阵(Augmented Matrix),记作 [Ab][A \mid \mathbf{b}]A~\tilde{A}。增广矩阵一次性完整编码了线性方程组的全部信息,是 高斯消元法(Gaussian Elimination)的直接操作对象。

核心性质

系数矩阵的(Rank),即其线性无关行(或列)的最大数目,是判定线性方程组解的结构的关键量。设 r=rank(A)r = \operatorname{rank}(A)

  1. 方程组 Ax=bA\mathbf{x} = \mathbf{b} 有解的充分必要条件是 rank(A)=rank(A~)\operatorname{rank}(A) = \operatorname{rank}(\tilde{A}) —— 即常数向量 b\mathbf{b} 必须落在 AA 的列空间中。
  2. 当方程组相容(有解)时,若 r=nr = n(列满秩),解唯一;若 r<nr < n,则存在无穷多解,解空间的维数为 nrn - r
  3. 对于齐次方程组 Ax=0A\mathbf{x} = \mathbf{0},零解总是存在。当 r<nr < n 时,还存在非零解(非平凡解),此时 AA奇异矩阵(Singular Matrix)。当 m=nm = n 时,det(A)=0\det(A) = 0

m=nm = nrank(A)=n\operatorname{rank}(A) = n(即方阵 AA 满秩、可逆)时,方程组有唯一解 x=A1b\mathbf{x} = A^{-1}\mathbf{b}。这一条件也是 克拉默法则(Cramer's Rule)xi=det(Ai)/det(A)x_i = \det(A_i) / \det(A) 适用的前提。

从线性变换的角度,矩阵 AA 定义了从 Rn\mathbb{R}^nRm\mathbb{R}^m 的线性映射 xAx\mathbf{x} \mapsto A\mathbf{x}。解的存在性等价于 b\mathbf{b} 属于 AA 的像空间(列空间);解的唯一性等价于该映射的核(零空间)仅含零向量。这一几何视角统一了秩、可逆性和解空间维数等概念。

系数矩阵的分类

系数矩阵可按多种标准分类,每种分类对应不同的数学性质与求解策略。

按形状分类:当 m=nm = n 时,系数矩阵为方阵,此时可进一步讨论行列式、可逆性和特征值;当 m>nm > n 时,方程为超定系统(方程数多于未知量),通常无精确解,转而寻求 最小二乘法 意义下的近似解;当 m<nm < n 时,方程为欠定系统(方程数少于未知量),若相容则有无穷多解,可借助 正则化 方法(如岭回归)选择满足附加准则的特解。

按结构分类:若 AA对角矩阵,则各方程相互独立,每个未知量可直接求解;若 AA三角矩阵(上三角或下三角),则可通过前向代入或回代在 O(n2)O(n^2) 时间内高效求解;若 AA对称矩阵正定或半正定,则可使用 Cholesky 分解 将求解复杂度降至约 n3/3n^3/3;若 AA稀疏矩阵(大多数元素为零),则适合采用迭代法或专门的稀疏直接求解器以节省存储与计算资源。

按数值性态分类:系数矩阵的条件数 κ(A)=AA1\kappa(A) = \|A\| \cdot \|A^{-1}\| 度量了求解对误差的敏感程度。条件数接近 1 时矩阵为良态(well-conditioned),求解稳定;条件数远大于 1 时矩阵为病态(ill-conditioned),微小的数据扰动即可能导致解的巨大偏移。多重共线性 在计量经济学中本质上就是设计矩阵 XX 列近似线性相关导致 XXX^\top X 条件数极大、估计量方差膨胀的问题。

经济学中的核心应用

投入产出分析:在 列昂惕夫(Leontief)投入产出模型中,技术系数矩阵(直接消耗系数矩阵)AA 的各元素 aija_{ij} 表示部门 jj 生产一单位产出所需消耗的部门 ii 产品的数量。总产出向量 x\mathbf{x} 满足 x=Ax+f\mathbf{x} = A\mathbf{x} + \mathbf{f},其中 f\mathbf{f} 为最终需求向量。求解得到 x=(IA)1f\mathbf{x} = (I - A)^{-1}\mathbf{f},系数矩阵 IAI - A 的可逆性是模型有经济意义解的前提,其逆 (IA)1(I - A)^{-1} 即为 列昂惕夫逆矩阵,刻画了最终需求对总产出的完全拉动效应。

计量经济学普通最小二乘法(OLS)中,正规方程 XXβ^=XyX^\top X \hat{\boldsymbol{\beta}} = X^\top \mathbf{y} 的系数矩阵为 XXX^\top Xp×pp \times p 的 Gram 矩阵),其可逆性是 OLS 估计量唯一存在的条件。若设计矩阵 XX 不满足列满秩(存在 完全共线性),则 XXX^\top X 奇异,OLS 无唯一解。工具变量法(IV)和 两阶段最小二乘法(2SLS)同样以各自的正规方程系数矩阵为基础,其可逆条件直接对应 可识别性 中的秩条件。

向量自回归模型:在 向量自回归模型(VAR)中,yt=c+A1yt1++Apytp+εt\mathbf{y}_t = \mathbf{c} + \mathbf{A}_1 \mathbf{y}_{t-1} + \cdots + \mathbf{A}_p \mathbf{y}_{t-p} + \boldsymbol{\varepsilon}_t,每个 Ai\mathbf{A}_i 均为 n×nn \times n 系数矩阵。将 VAR(pp) 改写为 VAR(1) 形式时构造的伴随矩阵(Companion Matrix),其系数矩阵的特征值模长决定系统的稳定性——所有特征值位于单位圆内是协方差平稳的条件,也是 脉冲响应分析 中冲击效应收敛的保证。

线性规划:标准形式的线性规划问题以 mincx\min \mathbf{c}^\top \mathbf{x} 为目标,受约束于 Ax=b,x0A\mathbf{x} = \mathbf{b}, \mathbf{x} \geq \mathbf{0},其中 AAm×nm \times n 的技术系数矩阵。单纯形法 的每次迭代在系数矩阵 AA 的基矩阵(一个 m×mm \times m 可逆子矩阵)之间进行枢轴操作,出基变量与进基变量的选择直接依赖系数矩阵各列的相对信息。

一般均衡与 CGE 模型瓦尔拉斯均衡中市场出清条件经线性化后构成大规模线性系统,其系数矩阵通常高度稀疏——每个市场仅涉及有限数量的商品和主体。可计算一般均衡(CGE)模型求解的数值性态(收敛速度与精度)由该系数矩阵的条件数决定。

与其他概念的关系

系数矩阵与 线性方程组矩阵行列式逆矩阵 等概念紧密关联。系数矩阵的转置 AA^\top对偶问题(如线性规划的对偶)中扮演对称角色:原问题与对偶问题使用互为转置的系数矩阵。当系数矩阵为 对称矩阵 且正定时,线性系统的求解可借助 Cholesky 分解 在约 n3/3n^3/3 次操作内完成,大幅优于一般 LU 分解。在 数值线性代数 中,系数矩阵的条件数(Condition Number)κ(A)=AA1\kappa(A) = \|A\| \cdot \|A^{-1}\| 度量了舍入误差对解的相对误差的放大上限,是评估算法数值稳定性的核心指标。

系数矩阵的概念也延伸至非线性系统:雅可比矩阵 以一阶偏导数构成非线性方程组在当前点处的"局部系数矩阵",支撑 牛顿法 的迭代求解和 比较静态分析 中隐函数定理的应用。在 DSGE 模型中,政策函数和状态转移方程的线性近似同样依赖雅可比矩阵构成的局部系数系统。

此外,系数矩阵在联立方程模型的识别问题中扮演关键角色。可识别性 的秩条件要求:对某一结构方程中被排除的外生变量在系统其余方程中的系数所构成的矩阵,其秩必须等于系统中内生变量总数减一。这一矩阵本质上就是从结构参数中选取的特定系数子矩阵,其满秩性决定了该方程能否被唯一估计。