ARTICLE

可行广义最小二乘法

可行广义最小二乘法 (Feasible Generalized Least Squares, FGLS) 可行广义最小二乘法(Feasible Generalized Least Squares,简称 FGLS)是计量经济学中处理非球形扰动项(non-spherical errors)的核心估计方法。当线性回归模型的误差项存在异方差(heteroskedas

浏览 6 更新 2025-10-26

可行广义最小二乘法 (Feasible Generalized Least Squares, FGLS)

可行广义最小二乘法(Feasible Generalized Least Squares,简称 FGLS)是计量经济学中处理非球形扰动项(non-spherical errors)的核心估计方法。当线性回归模型的误差项存在异方差(heteroskedasticity)或自相关(autocorrelation)时,普通最小二乘法(OLS)虽然仍保持无偏性和一致性,但不再是最优线性无偏估计量(BLUE)。理论上,若误差协方差矩阵 Ω\Omega 已知,广义最小二乘法(GLS)可以通过对数据进行加权变换恢复最优效率。然而在实际应用中,Ω\Omega 几乎总是未知的——这正是 FGLS 所要解决的根本问题:先估计 Ω\Omega,再以估计的协方差结构执行 GLS 变换,从而在渐近意义上恢复有效性。

统计框架

考虑经典线性回归模型的推广形式:

y=Xβ+ε,E[ε]=0,Var(ε)=σ2Ωy = X\beta + \varepsilon, \quad \mathbb{E}[\varepsilon] = 0, \quad \operatorname{Var}(\varepsilon) = \sigma^2 \Omega

其中 Ω\Omega 是一个 n×nn \times n 的对称正定矩阵,它偏离了球形假设 Ω=In\Omega = I_n。当 Ω\Omega 已知时,GLS 估计量为:

β^GLS=(XΩ1X)1XΩ1y\hat{\beta}_{\text{GLS}} = (X'\Omega^{-1}X)^{-1} X'\Omega^{-1}y

该估计量是 BLUE,且在高斯假设下达到 Cramér-Rao下界。问题在于 Ω\Omega 通常未知,直接使用 GLS 不可行。

FGLS 的核心策略是将未知的 Ω\Omega 替换为其一致估计量 Ω^\hat{\Omega},从而得到:

β^FGLS=(XΩ^1X)1XΩ^1y\hat{\beta}_{\text{FGLS}} = (X'\hat{\Omega}^{-1}X)^{-1} X'\hat{\Omega}^{-1}y

两步估计程序

FGLS 的标准实施分为两个阶段:

第一步:以 OLS 估计原方程,获得残差向量 ε^=yXβ^OLS\hat{\varepsilon} = y - X\hat{\beta}_{\text{OLS}}。由于 OLS 在非球形扰动下仍保持一致性(尽管非有效),基于残差的 Ω\Omega 估计通常是可行的。

第二步:利用残差估计误差协方差结构 Ω^\hat{\Omega},然后代入 GLS 公式。Ω^\hat{\Omega} 的具体构造取决于误差结构的假设:

  1. 异方差情形(加权最小二乘法,WLS/Feasible WLS):假设 Ω=diag(ω1,,ωn)\Omega = \operatorname{diag}(\omega_1, \ldots, \omega_n),即误差仅存在异方差而无自相关。通常建模 ωi\omega_i 为某些解释变量 ziz_i 的函数,例如 ωi=exp(ziγ)\omega_i = \exp(z_i'\gamma)ωi=(ziγ)2\omega_i = (z_i'\gamma)^2。以 ε^i2\hat{\varepsilon}_i^2 为因变量,估计辅助回归获得 ω^i\hat{\omega}_i,然后以 1/ω^i1/\sqrt{\hat{\omega}_i} 为权重执行加权最小二乘。这一方法也常被称为 可行加权最小二乘法(Feasible WLS)。
  2. 自相关情形:若误差服从 AR(1) 过程 εt=ρεt1+ut\varepsilon_t = \rho \varepsilon_{t-1} + u_tutu_t 为白噪声),则 Ω\Omega 具有带状托普利兹结构,其元素为 Ωij=ρij\Omega_{ij} = \rho^{|i-j|}。实践中先用 OLS 残差估计 ρ^\hat{\rho},再利用 Cochrane-Orcutt迭代法Prais-Winsten变换 进行变换估计。
  3. 面板数据:在随机效应模型中,Ω=σε2INT+σα2(INJT)\Omega = \sigma_\varepsilon^2 I_{NT} + \sigma_\alpha^2 (I_N \otimes J_T),其中 σα2\sigma_\alpha^2 为个体效应方差,σε2\sigma_\varepsilon^2 为特异性误差方差。FGLS 先估计方差分量 σ^α2,σ^ε2\hat{\sigma}_\alpha^2, \hat{\sigma}_\varepsilon^2,再实施广义最小二乘法(GLS)获得随机效应估计量。
  4. 似不相关回归(SUR):在多方程系统中,各方程误差跨个体相关。FGLS 先用逐个方程的 OLS 残差估计方程间协方差矩阵 Σ^\hat{\Sigma},再对整个方程组执行联合 GLS。

渐近性质

在适当的正则条件下,FGLS 具有以下渐近性质:

  • 一致性:若 Ω^pΩ\hat{\Omega} \xrightarrow{p} \Omega(即对 Ω\Omega 的估计一致),则 β^FGLSpβ\hat{\beta}_{\text{FGLS}} \xrightarrow{p} \beta。一致性的成立依赖于 Ω\Omega 的参数化设定正确,以及辅助回归中使用的工具或函数形式恰当。
  • 渐近有效性:当 Ω^\hat{\Omega} 一致时,FGLS 具有与已知 Ω\Omega 的 GLS 相同的渐近分布,即达到渐近有效性。但在有限样本中,由于 Ω^\hat{\Omega} 的估计误差,FGLS 并非严格意义上的 BLUE。
  • 渐近正态性n(β^FGLSβ)dN(0,σ2(XΩ1X/n)1)\sqrt{n}(\hat{\beta}_{\text{FGLS}} - \beta) \xrightarrow{d} \mathcal{N}(0, \sigma^2 (X'\Omega^{-1}X/n)^{-1}),在 Ω\Omega 被一致估计的条件下成立。
  • 迭代 FGLS:若以 FGLS 获得的残差重新估计 Ω\Omega,再次执行 GLS,如此反复直至收敛,此过程称为迭代 FGLS 或 迭代加权最小二乘法(IRLS)。在正态分布假设下,迭代 FGLS 等价于最大似然估计(MLE)。

与稳健标准误的比较

当研究者不确定误差协方差结构的具体形式时,存在两种主要的处理策略:

  1. FGLS 路径:明确假设 Ω\Omega 的参数形式(如异方差函数 h(ziγ)h(z_i'\gamma) 或 AR(1) 结构),以 FGLS 获得有效性增益,但面临模型设定错误的风险——若 Ω\Omega 的参数模型被错误指定,FGLS 可能不再一致。
  2. 稳健标准误路径:保留 OLS 的点估计(因其始终一致),但使用Eicker-Huber-White标准误(异方差稳健)或 Newey-West标准误(异方差-自相关稳健)对协方差矩阵进行修正。该路径牺牲了潜在的有效性增益,但不对 Ω\Omega 的结构作强假设,更为稳健。

二者的权衡反映了计量经济学中"效率-稳健性"的经典张力。在大样本下,若对误差结构有充分的先验知识或理论指引,FGLS 通常是更好的选择;若样本量有限或误差结构难以建模,稳健标准误路径更为安全。

实际应用中的注意事项

模型设定风险:FGLS 的一致性和有效性严格依赖于 Ω^\hat{\Omega} 的一致性,而后者又依赖于误差协方差结构参数模型被正确设定。实践中建议以Breusch-Pagan检验诊断异方差的形式,以Durbin-Watson检验Breusch-Godfrey检验诊断自相关的阶数,为 FGLS 的设定提供实证依据。

小样本偏误:由于 FGLS 使用估计的权重矩阵而非真实权重矩阵,在有限样本中可能存在向下的标准误偏误,导致检验过度拒绝。当样本量较小时,应谨慎解释 FGLS 的推断结果,或使用 bootstrap 方法进行有限样本校正。

Hausman检验的衔接:在面板数据的固定效应与随机效应选择中,FGLS 提供的随机效应估计量是 Hausman 检验"有效但脆弱"一方的测试对象。理解 FGLS 的依赖条件——Cov(xit,αi)=0\operatorname{Cov}(x_{it}, \alpha_i) = 0——是正确运用 Hausman 检验的前提。