ARTICLE

分块回归

分块回归 (Partitioned Regression) 分块回归（Partitioned Regression）是计量经济学与线性代数中处理多元线性回归模型的一种重要技术。它允许研究者将解释变量分成不同的组别，并分别考察某一组变量在剔除其他变量影响后对因变量的净效应。这一理论的核心支撑是著名的Frisch-Waugh-Lovell定理（FWL Theor

浏览 0 更新 2025-12-20

分块回归 (Partitioned Regression)

分块回归（Partitioned Regression）是计量经济学与线性代数中处理多元线性回归模型的一种重要技术。它允许研究者将解释变量分成不同的组别，并分别考察某一组变量在剔除其他变量影响后对因变量的净效应。这一理论的核心支撑是著名的Frisch-Waugh-Lovell定理（FWL Theorem）。

模型设定与FWL定理

考虑一个标准的线性模型，将其设计矩阵 $X$ 划分为两个子集（或分块） $X_1$ 和 $X_2$ ：

Y = X_1\beta_1 + X_2\beta_2 + \epsilon

其中 $Y$ 是 $n \times 1$ 的被解释变量向量， $X_1$ 是 $n \times k_1$ 的矩阵包含第一组变量（如控制变量）， $X_2$ 是 $n \times k_2$ 的矩阵包含第二组变量（如研究者关心的核心解释变量）， $\beta_1$ 和 $\beta_2$ 分别是对应的待估计参数， $\epsilon$ 是随机扰动项。在普通最小二乘法（OLS）的框架下，目标是找到使残差平方和最小化的估计量 $\hat{\beta}_1$ 和 $\hat{\beta}_2$ 。

Frisch-Waugh-Lovell定理提供了分块回归的理论基础。该定理指出，通过以下三个步骤得到的 $X_2$ 的系数估计值，与直接对全样本进行OLS回归得到的 $\hat{\beta}_2$ 完全一致：第一步，将 $Y$ 对 $X_1$ 进行回归，得到残差向量 $e_{Y|X_1}$ ，这个残差代表了 $Y$ 中无法被 $X_1$ 解释的部分。第二步，将 $X_2$ 的每一列分别对 $X_1$ 进行回归，得到残差矩阵 $e_{X_2|X_1}$ ，这个残差矩阵代表了 $X_2$ 中与 $X_1$ 线性无关的净变化部分。第三步，将 $e_{Y|X_1}$ 对 $e_{X_2|X_1}$ 进行回归，所得的系数向量即为 $\hat{\beta}_2$ 。

数学推导与投影矩阵

为了严谨地证明上述过程，需要引入投影矩阵和残差生成矩阵。定义针对 $X_1$ 的投影矩阵 $P_1 = X_1(X_1'X_1)^{-1}X_1'$ ，对应的残差生成矩阵 $M_1 = I - P_1 = I - X_1(X_1'X_1)^{-1}X_1'$ 。 $M_1$ 具有三个重要性质：幂等性（ $M_1 M_1 = M_1$ ）、对称性（ $M_1' = M_1$ ）、正交性（ $M_1 X_1 = 0$ ，意味着 $M_1$ 可以将任何向量投影到与 $X_1$ 所在的列空间正交的正交补空间中）。

回到回归方程，在等号两边同时左乘 $M_1$ ： $M_1 Y = M_1 X_1 \beta_1 + M_1 X_2 \beta_2 + M_1 \epsilon$ 。由于 $M_1 X_1 = 0$ ，上式简化为 $M_1 Y = M_1 X_2 \beta_2 + M_1 \epsilon$ 。此时 $\beta_2$ 的OLS估计量为：

\hat{\beta}_2 = (X_2' M_1 X_2)^{-1} X_2' M_1 Y

这说明 $\hat{\beta}_2$ 仅取决于 $Y$ 和 $X_2$ 在 $X_1$ 正交空间上的投影。

经济学意义与应用

分块回归在经济学研究中具有深刻的直观意义，通常被称为变量剥离或偏回归（Partialling Out）。在进行实证分析时，我们往往担心研究的核心变量 $X_2$ 与其他变量 $X_1$ 存在相关性。如果直接做 $Y$ 对 $X_2$ 的一元回归，可能会产生遗漏变量偏差。通过分块回归的逻辑可以理解：加入 $X_1$ 作为控制变量，本质上是从 $Y$ 和 $X_2$ 中抽离掉受 $X_1$ 影响的部分； $\hat{\beta}_2$ 衡量的是在保持 $X_1$ 不变的情况下， $X_2$ 变动一个单位对 $Y$ 的影响，这种"保持不变"在数学上通过 $M_1$ 矩阵的正交化处理得以实现。

分块回归不仅在理论上重要，在数值计算和统计诊断中也有广泛应用。通过分块回归得到的残差 $e_{Y|X_1}$ 和 $e_{X_2|X_1}$ 之间的相关性，即为 $Y$ 与 $X_2$ 在控制了 $X_1$ 之后的偏相关系数。在多重共线性诊断方面，如果 $X_2$ 能够被 $X_1$ 很好地解释，那么 $M_1 X_2$ 将趋近于零，导致 $(X_2' M_1 X_2)$ 矩阵接近奇异矩阵，这正是多重共线性导致标准误膨胀的数学解释。在添加变量检验中，在现有模型中加入新变量，可以通过分块回归快速判断该新变量是否有显著的解释力，而不必重新计算整个模型的逆矩阵。

总结

分块回归是理解多元线性回归精髓的关键。它告诉我们，多元回归并非简单的相关性叠加，而是一种在复杂的变量网络中提取净效应的过程。掌握了分块回归，就掌握了高斯-马尔可夫定理在复杂模型下的运作机理，也为后续学习面板数据分析中的固定效应模型（如组内变换）打下了坚实的数学基础。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。