ARTICLE

异方-差性

异方差性 (Heteroscedasticity) 异方差性(Heteroscedasticity)是计量经济学与回归分析中的核心概念,指回归模型中随机误差项 u_i 的方差随观测值 i 变化而非保持常数的情形。它是违反古典线性回归模型(CLRM)同方差性(Homoscedasticity)假设的典型表现。数学上,同方差假设要求 Var(u_i X_i) =

浏览 3 更新 2025-07-15

异方差性 (Heteroscedasticity)

异方差性(Heteroscedasticity)是计量经济学回归分析中的核心概念,指回归模型中随机误差项 ui u_i 的方差随观测值 i i 变化而非保持常数的情形。它是违反古典线性回归模型(CLRM)同方差性(Homoscedasticity)假设的典型表现。数学上,同方差假设要求 Var(uiXi)=σ2 \mathrm{Var}(u_i \mid X_i) = \sigma^2 对所有 i i 成立;而异方差性意味着 Var(uiXi)=σi2σ2 \mathrm{Var}(u_i \mid X_i) = \sigma_i^2 \neq \sigma^2 ,即不同观测点对应不同的误差方差。

异方差性在横截面数据中尤为普遍。典型的例子包括:以收入解释消费的回归中,高收入家庭的消费波动显著大于低收入家庭,因为后者几乎全部收入用于基本开支,消费模式单一;分析企业规模与利润关系时,大企业的利润变异幅度远超小企业——巨额盈利与巨额亏损皆有可能。这些情形下,残差散点图常呈现"扇形"或"漏斗形"模式,即随自变量增大,残差波动范围逐步扩大。

主要成因

异方差性的成因涵盖多个方面:数据本身的异质性(如分析对象在规模或能力上差异悬殊)、模型设定偏误(遗漏重要解释变量或函数形式错误,如将非线性关系误设为线性)、异常值的干扰、以及测量误差在数据子集间的结构性差异。

对OLS估计的影响

当存在异方差性时,OLS估计量仍保持无偏性一致性,但不再是有效的——即不再是高斯-马尔可夫定理所保证的最佳线性无偏估计量(BLUE),因为存在其他线性无偏估计量(如加权最小二乘法)具有更小的方差。更严重的是,OLS标准误公式 SE(β^j)=s2[(XX)1]jj \mathrm{SE}(\hat{\beta}_j) = \sqrt{s^2 [(X'X)^{-1}]_{jj}} 依赖于同方差假设,异方差下这些标准误有偏(通常被低估),导致 t t 检验和 F F 检验失效,置信区间不可靠,第I类错误(假阳性)的概率增大,推断结论的可信度大打折扣。

检测方法

诊断异方差性首先可通过图形法:绘制残差 ei e_i 对拟合值 Y^i \hat{Y}_i 或自变量的散点图,观察是否呈现扩散或收缩模式。正式检验包括:

  • Breusch-Pagan检验:以 ei2 e_i^2 对原始自变量进行辅助回归,检验统计量 nR2 nR^2 在大样本下渐近服从 χp2 \chi^2_p 分布,H0 H_0 为同方差。
  • White检验:将 ei2 e_i^2 对自变量的水平项、平方项和交叉乘积项作回归,能检测更广泛形式的异方差(包括非线性形式),但自由度消耗较大。
  • Goldfeld-Quandt检验:将数据按某自变量排序后去除中间约20\%的观测值,比较两端子样本的残差平方和,构造 F F 统计量。

补救措施

处理异方差性的方法主要有三类:加权最小二乘法(WLS)是根本性方法——若异方差形式已知,通过对每个观测值赋予权重 wi=1/σi2 w_i = 1/\sigma_i^2 可恢复有效性,实践中常采用可行广义最小二乘法(FGLS)估计权重。当异方差形式未知时,异方差稳健标准误(White标准误,亦称Sandwich估计量)提供了最便捷的替代方案:OLS系数保持不变,仅使用 Var^HC0(β^)=(XX)1(ei2xixi)(XX)1 \widehat{\mathrm{Var}}_{\mathrm{HC0}}(\hat{\beta}) = (X'X)^{-1}(\sum e_i^2 x_i x_i')(X'X)^{-1} 调整标准误,小样本修正版本(HC1、HC2、HC3)进一步改善了有限样本表现。此外,变量变换(如对因变量取对数 lnY \ln Y ,压缩大规模数据的变异幅度)和模型重新设定(引入二次项、交互项或改用对数线性模型)也可从根源上缓解异方差问题。

异方差性是应用计量经济学中最常见也最重要的数据问题之一。在现代实证研究规范中,汇报异方差稳健标准误已是一项标准稳健性检验程序,忽视异方差性被视为严重的方法论缺陷。理解其本质、掌握其检测与修正方法,是每位从事定量研究的经济学者和数据分析师的基本功。