ARTICLE

弗里施-瓦格-洛维尔定理

弗里施-瓦格-洛维尔定理 (FWL Theorem) 概述 弗里施-瓦格-洛维尔定理(Frisch-Waugh-Lovell Theorem,简称FWL定理)是计量经济学和统计学中关于多元线性回归的核心定理。该定理由Ragnar Frisch与Frederick Waugh于1933年首次提出,后由Michael Lovell于1963年推广并正式命名。FW

浏览 0 更新 2026-05-28

弗里施-瓦格-洛维尔定理 (FWL Theorem)

概述

弗里施-瓦格-洛维尔定理(Frisch-Waugh-Lovell Theorem,简称FWL定理)是计量经济学统计学中关于多元线性回归的核心定理。该定理由Ragnar FrischFrederick Waugh于1933年首次提出,后由Michael Lovell于1963年推广并正式命名。FWL定理揭示:在多元线性回归Y=X1β1+X2β2+εY = X_1\beta_1 + X_2\beta_2 + \varepsilon中,参数子向量β1\beta_1普通最小二乘法{OLS}估计量可以通过一个三步"偏回归"过程等价获得,且该过程具有直观的"控制其他变量后"的统计解释。

FWL定理不仅是计量经济学的理论基石,也是理解偏相关残差化以及诸多高级方法(如固定效应模型两阶段最小二乘法)概念基础的关键桥梁。

定理陈述

考虑线性回归模型

Y=X1β1+X2β2+ε,Y = X_1\beta_1 + X_2\beta_2 + \varepsilon,

其中YYn×1n\times 1被解释变量向量,X1X_1n×k1n\times k_1回归子矩阵,X2X_2n×k2n\times k_2回归子矩阵,β1\beta_1β2\beta_2为对应的系数向量,ε\varepsilon为随机扰动项。FWL定理指出,β1\beta_1的OLS估计量β^1\hat{\beta}_1可以通过以下三步获得:

  1. 第一步(被解释变量残差化):YYX2X_2进行OLS回归,得到残差向量 \[ Y^* = M_2 Y = Y - X_2(X_2'X_2)^{-1}X_2'Y, \] 其中M2=IX2(X2X2)1X2M_2 = I - X_2(X_2'X_2)^{-1}X_2'称为残差生成矩阵(annihilator / residual maker matrix),其作用是将变量中可由X2X_2线性解释的部分"投影"出去。
  2. 第二步(解释变量残差化):X1X_1的每一列分别对X2X_2进行OLS回归,得到残差矩阵 \[ X_1^* = M_2 X_1 = X_1 - X_2(X_2'X_2)^{-1}X_2'X_1. \]
  3. 第三步(最终回归): 将第一步得到的残差YY^*对第二步得到的残差X1X_1^*进行OLS回归(无截距项),得到 \[ \hat{\beta}_1^{\text{FWL}} = (X_1^{*'}X_1^*)^{-1}X_1^{*'}Y^*. \]

核心结论: β^1FWL=β^1\hat{\beta}_1^{\text{FWL}} = \hat{\beta}_1,即三步偏回归得到的系数估计量等于原始多元回归中β1\beta_1的OLS估计量。此外,两步回归的残差也完全相等。

代数证明

记完整设计矩阵X=[X1  X2]X = [X_1 \; X_2],则β=(β1,β2)\beta = (\beta_1', \beta_2')'的OLS估计为 β^\hat{\beta} = (X'X)^{-1}X'Y. 利用分块矩阵求逆公式,可得β^1\hat{\beta}_1的解析表达式:

β^1=(X1M2X1)1X1M2Y,\hat{\beta}_1 = (X_1'M_2X_1)^{-1}X_1'M_2Y,

其中M2=IX2(X2X2)1X2M_2 = I - X_2(X_2'X_2)^{-1}X_2'

另一方面,FWL第三步的估计量为

β^1FWL=((M2X1)M2X1)1((M2X1)M2Y).\hat{\beta}_1^{\text{FWL}} = ((M_2X_1)'M_2X_1)^{-1}((M_2X_1)'M_2Y).

由于M2M_2对称幂等矩阵M2=M2M_2' = M_2M22=M2M_2^2 = M_2),故

(M2X1)M2X1=X1M2M2X1=X1M2X1,(M_2X_1)'M_2X_1 = X_1'M_2M_2X_1 = X_1'M_2X_1,
(M2X1)M2Y=X1M2M2Y=X1M2Y.(M_2X_1)'M_2Y = X_1'M_2M_2Y = X_1'M_2Y.

因此

β^1FWL=(X1M2X1)1X1M2Y=β^1.\hat{\beta}_1^{\text{FWL}} = (X_1'M_2X_1)^{-1}X_1'M_2Y = \hat{\beta}_1.

对于残差,原始回归残差为

ε^=YX1β^1X2β^2.\hat{\varepsilon} = Y - X_1\hat{\beta}_1 - X_2\hat{\beta}_2.

可以证明ε^=M2(YX1β^1)\hat{\varepsilon} = M_2(Y - X_1\hat{\beta}_1),而这正是FWL第三步回归的残差,说明两步回归的拟合残差完全一致。

直观解释

FWL定理给出了"控制其他变量"这一概念的精确统计表述。在多元回归中,系数β1\beta_1衡量的是在其他条件不变{ceteris paribus}的情况下X1X_1YY的边际影响。FWL三步法清晰地展示了这一过程:

  • 首先,从YY中剔除X2X_2的影响(第一步),得到YY中不能被X2X_2解释的"新信息"部分。
  • 其次,从X1X_1中同样剔除X2X_2的影响(第二步),得到X1X_1中不能被X2X_2解释的"净变异"部分。
  • 最后,考察这两部分"净信息"之间的线性关系(第三步),即得到X1X_1YY的净效应。

换言之,回归系数β^1\hat{\beta}_1衡量的并非X1X_1YY的原始相关,而是X1X_1YY在"剔除"了X2X_2的影响之后的偏相关关系。这正是"控制变量"的数学本质。

重要应用

FWL定理在计量经济学和统计学的诸多领域有广泛应用:

\subsubsection*{去均值回归}

X2X_2仅包含常数项(即X2=ιX_2 = \iota,长度为nn的元素全为1的列向量)时,M2=I1nιιM_2 = I - \frac{1}{n}\iota\iota'去均值矩阵(centering matrix)。此时FWL定理说明:多元回归中的斜率系数可以通过先将所有变量减去均值、再进行无截距回归来等价获得。这正是回归分析中"截距项自动中心化"的理论依据。

\subsubsection*{面板数据固定效应}

面板数据模型中,固定效应模型通过引入个体虚拟变量来控制个体异质性。直接估计包含nn个虚拟变量的模型在计算上效率较低。FWL定理表明,可以通过"组内去均值"(within transformation)——即将每个个体的观测值减去该个体各期均值——来剔除个体固定效应,然后对变换后的数据进行合并OLS{Pooled OLS}回归。这一方法等价于直接估计包含虚拟变量的完整模型,但计算量大幅降低。

\subsubsection*{季节性调整}

时间序列分析中,当数据存在季节性模式时,可以在回归中加入季度或月份虚拟变量作为X2X_2。FWL定理指出,可以先将原始序列对季节虚拟变量做回归以得到季节调整后的序列(残差),再对调整后的序列进行回归分析,从而有效剔除季节性波动的影响。

\subsubsection*{工具变量回归}

两阶段最小二乘法(2SLS)中,第一阶段将内生变量对所有外生变量(包括工具变量)回归,得到拟合值;第二阶段用拟合值替代内生变量进行回归。虽然2SLS并不完全等同于FWL定理的直接应用,但FWL定理为理解两阶段策略的"净化"作用提供了重要的概念框架。

历史背景

Ragnar Frisch是挪威著名经济学家,首届诺贝尔经济学奖{1969年}得主之一,也是计量经济学会{Econometric Society}的创始人。他在1933年与Frederick Waugh合作发表的论文《偏回归与偏相关系数的计算》中首次阐述了该定理的核心思想。1963年,Michael Lovell在《美国统计学会会刊》上发表了该定理的严格证明和推广,并将其命名为Frisch-Waugh定理,后世学者将其称为Frisch-Waugh-Lovell定理。

该定理不仅是理论计量经济学的经典成果,也是所有实证研究者理解多元回归分析本质的必修课。它揭示了统计学中"控制"概念的精确数学含义,连接了代数推导与直觉理解之间的鸿沟。

局限性

尽管FWL定理具有重要的理论和应用价值,但也存在一定局限性。首先,该定理严格依赖于线性模型假设;对于非线性模型(如Logit模型Probit模型),简单的三步回归不再等价于完整模型的估计。其次,FWL定理实质上是代数恒等式,不涉及任何统计假设(如零条件均值假设同方差性等),因此它本身不保证估计量的统计性质(如无偏性一致性),这些性质需要由模型的基本假设来保证。最后,在有限样本下,第二步回归中估计X1X_1^*带来的估计误差可能会影响统计推断的精度。