ARTICLE

方块矩阵

方块矩阵 (Block Matrix / Partitioned Matrix) 方块矩阵(也称分块矩阵,Block Matrix 或 Partitioned Matrix)是将一个大矩阵按行和列分割为若干子矩阵(称为"块"或"方块")的表示方式。每个子矩阵本身就是一个维度较小的矩阵,通过这种分块结构,复杂的矩阵运算可以被分解为子块上的运算,从而大幅简化推导

浏览 5 更新 2026-05-25

方块矩阵 (Block Matrix / Partitioned Matrix)

方块矩阵(也称分块矩阵,Block Matrix 或 Partitioned Matrix)是将一个大矩阵按行和列分割为若干子矩阵(称为"块"或"方块")的表示方式。每个子矩阵本身就是一个维度较小的矩阵,通过这种分块结构,复杂的矩阵运算可以被分解为子块上的运算,从而大幅简化推导和计算。

定义与记号

A\mathbf{A}m×nm \times n 矩阵。按行分成 pp 组、按列分成 qq 组后,A\mathbf{A} 可写为:

\mathbf{A} = \begin{pmatrix}

A11\mathbf{A}_{11} \& A12\mathbf{A}_{12} \& \cdots \& A1q\mathbf{A}_{1q} \\ A21\mathbf{A}_{21} \& A22\mathbf{A}_{22} \& \cdots \& A2q\mathbf{A}_{2q} \\ \vdots \& \vdots \& \ddots \& \vdots \\ Ap1\mathbf{A}_{p1} \& Ap2\mathbf{A}_{p2} \& \cdots \& Apq\mathbf{A}_{pq}

\end{pmatrix}

其中每个 Aij\mathbf{A}_{ij} 是一个 mi×njm_i \times n_j 子矩阵,满足 i=1pmi=m\sum_{i=1}^{p} m_i = mj=1qnj=n\sum_{j=1}^{q} n_j = n。分块的方式取决于问题的结构——常见的有 2×22 \times 2 分块(如回归分析中将截距项与斜率系数分开)和对角分块(如面板数据中每个截面单位对应一个对角块)。

方块矩阵的基本运算

方块矩阵的核心优势在于:只要子块之间的维度相容,分块形式的矩阵运算与标量形式的矩阵运算法则完全平行。

分块加法与数乘

A\mathbf{A}B\mathbf{B} 按相同方式分块,则加法逐块进行:(A+B)ij=Aij+Bij(\mathbf{A} + \mathbf{B})_{ij} = \mathbf{A}_{ij} + \mathbf{B}_{ij}。数乘则直接作用于每个子块。

分块乘法

分块乘法的规则与标准矩阵乘法一致,但以子块替代标量元素。设 A\mathbf{A} 的列分块方式与 B\mathbf{B} 的行分块方式匹配,则:

(AB)ij=kAikBkj(\mathbf{A}\mathbf{B})_{ij} = \sum_{k} \mathbf{A}_{ik} \mathbf{B}_{kj}

其中求和遍历对应维度相容的所有子块索引 kk

分块求逆

对于非奇异的 2×22 \times 2 分块方阵:

\mathbf{M} = \begin{pmatrix}

A\mathbf{A} \& B\mathbf{B} \\ C\mathbf{C} \& D\mathbf{D}

\end{pmatrix}

A\mathbf{A} 可逆,定义舒尔补 (Schur Complement) S=DCA1B\mathbf{S} = \mathbf{D} - \mathbf{C}\mathbf{A}^{-1}\mathbf{B},则分块逆矩阵为:

\mathbf{M}^{-1} = \begin{pmatrix}

A1\mathbf{A}^{-1} + A1\mathbf{A}^{-1}B\mathbf{B}S1\mathbf{S}^{-1}C\mathbf{C}A1\mathbf{A}^{-1} \& -A1\mathbf{A}^{-1}B\mathbf{B}S1\mathbf{S}^{-1} \\ -S1\mathbf{S}^{-1}C\mathbf{C}A1\mathbf{A}^{-1} \& S1\mathbf{S}^{-1}

\end{pmatrix}

D\mathbf{D} 可逆,则使用另一舒尔补 T=ABD1C\mathbf{T} = \mathbf{A} - \mathbf{B}\mathbf{D}^{-1}\mathbf{C} 构建对称的分块逆公式。分块求逆在经济学推导中极为重要——例如从参数的联合协方差矩阵中提取单个参数的边际方差。

分块行列式

对于上述 M\mathbf{M}2×22 \times 2 分块,行列式可通过舒尔补计算:

det(M)=det(A)det(DCA1B)=det(D)det(ABD1C)\det(\mathbf{M}) = \det(\mathbf{A}) \cdot \det(\mathbf{D} - \mathbf{C}\mathbf{A}^{-1}\mathbf{B}) = \det(\mathbf{D}) \cdot \det(\mathbf{A} - \mathbf{B}\mathbf{D}^{-1}\mathbf{C})

这一性质在多元正态分布的条件分布的协方差行列式计算中频繁使用。

计量经济学中的应用

方块矩阵是计量经济学中处理多变量系统的基本工具。

分区回归与弗里施-沃-洛弗尔定理

考虑线性回归模型 y=X1β1+X2β2+ε\mathbf{y} = \mathbf{X}_1\boldsymbol{\beta}_1 + \mathbf{X}_2\boldsymbol{\beta}_2 + \boldsymbol{\varepsilon}。将设计矩阵分块为 X=[X1  X2]\mathbf{X} = [\mathbf{X}_1 \; \mathbf{X}_2],正规方程即为 2×22 \times 2 分块形式。弗里施-沃-洛弗尔定理 (Frisch–Waugh–Lovell Theorem) 的核心推导——先剔除 X1\mathbf{X}_1 的影响再回归——完全依赖于分块矩阵求逆公式中舒尔补的性质。

似不相关回归 (SUR)

似不相关回归 (Seemingly Unrelated Regressions) 中,MM 个方程的协方差矩阵 ΣI\boldsymbol{\Sigma} \otimes \mathbf{I} 本身具有方块结构。当各方程的解释变量相同、且协方差矩阵为对角阵时,分块结构退化为广义最小二乘法 (GLS) 的等价于逐方程普通最小二乘法 (OLS) 的特例。

面板数据中的组间与组内估计

面板数据模型:

yit=xitβ+αi+εity_{it} = \mathbf{x}_{it}'\boldsymbol{\beta} + \alpha_i + \varepsilon_{it}

其矩阵形式可按个体分块为对角结构。组内估计量 (Within Estimator) 利用零化矩阵 (Annihilator Matrix) 消去个体效应块,组间估计量 (Between Estimator) 则仅利用块均值。这两种估计量的关系可由分块矩阵的正交投影统一表述。

经济学中的其他应用

  1. 投入产出分析里昂惕夫 (Leontief) 投入产出模型中的技术系数矩阵常按产业部门分为中间投入块、最终需求块和初始投入块。矩阵 IA\mathbf{I} - \mathbf{A} 的分块求逆产生里昂惕夫逆矩阵,反映任意部门需求冲击通过各块的传导。
  2. 博弈论中的多市场均衡:当多个市场的策略互动存在分块可分离性——例如局部网络效应中,不同社群间的策略交互较弱——支付矩阵呈现近似块对角结构,可利用方块矩阵的性质简化纳什均衡的计算。
  3. 动态系统与 VAR 模型:在向量自回归 (VAR) 模型中,伴随矩阵 (Companion Matrix) 将高阶 VAR 转化为一阶系统的状态空间表示,其分块结构(上块为系数矩阵,下块为单位矩阵和零矩阵)使脉冲响应和方差分解的分析得以系统化。
  4. 空间计量经济学:空间权重矩阵 W\mathbf{W} 与参数矩阵的分块组合产生空间杜宾模型 (SDM) 和空间误差模型 (SEM) 中不同的分块结构,决定了空间溢出效应的传导路径。

分块对角化与可分性

当方块矩阵为分块对角矩阵 (Block Diagonal Matrix) 时,问题完全解耦:每个对角块可独立处理,对应的变量组之间无交叉作用。这种结构的出现通常意味着经济学上的可分离性 (Separability)——例如,消费者效用函数的强可分性导致需求系统的斯拉茨基矩阵呈现特定的分块结构;生产函数中投入品的弱可分性意味着成本函数的海塞矩阵可按投入品组别分块对角化。

方块矩阵不仅是一种计算工具,更是揭示经济系统结构性关系的一种语言。通过恰当的分块,原本混杂的高维问题可以被分解为具有经济含义的低维子问题,这正是计量经济学和数量经济学中"分块即理解"的方法论核心。