ARTICLE
异方-差性
异方差性 (Heteroscedasticity) 异方差性(Heteroscedasticity)是计量经济学与回归分析中的核心概念,指回归模型中随机误差项 u_i 的方差随观测值 i 变化而非保持常数的情形。它是违反古典线性回归模型(CLRM)同方差性(Homoscedasticity)假设的典型表现。数学上,同方差假设要求 Var(u_i X_i) =
异方差性 (Heteroscedasticity)
异方差性(Heteroscedasticity)是计量经济学与回归分析中的核心概念,指回归模型中随机误差项 的方差随观测值 变化而非保持常数的情形。它是违反古典线性回归模型(CLRM)同方差性(Homoscedasticity)假设的典型表现。数学上,同方差假设要求 对所有 成立;而异方差性意味着 ,即不同观测点对应不同的误差方差。
异方差性在横截面数据中尤为普遍。典型的例子包括:以收入解释消费的回归中,高收入家庭的消费波动显著大于低收入家庭,因为后者几乎全部收入用于基本开支,消费模式单一;分析企业规模与利润关系时,大企业的利润变异幅度远超小企业——巨额盈利与巨额亏损皆有可能。这些情形下,残差散点图常呈现"扇形"或"漏斗形"模式,即随自变量增大,残差波动范围逐步扩大。
主要成因
异方差性的成因涵盖多个方面:数据本身的异质性(如分析对象在规模或能力上差异悬殊)、模型设定偏误(遗漏重要解释变量或函数形式错误,如将非线性关系误设为线性)、异常值的干扰、以及测量误差在数据子集间的结构性差异。
对OLS估计的影响
当存在异方差性时,OLS估计量仍保持无偏性和一致性,但不再是有效的——即不再是高斯-马尔可夫定理所保证的最佳线性无偏估计量(BLUE),因为存在其他线性无偏估计量(如加权最小二乘法)具有更小的方差。更严重的是,OLS标准误公式 依赖于同方差假设,异方差下这些标准误有偏(通常被低估),导致 检验和 检验失效,置信区间不可靠,第I类错误(假阳性)的概率增大,推断结论的可信度大打折扣。
检测方法
诊断异方差性首先可通过图形法:绘制残差 对拟合值 或自变量的散点图,观察是否呈现扩散或收缩模式。正式检验包括:
- Breusch-Pagan检验:以 对原始自变量进行辅助回归,检验统计量 在大样本下渐近服从 分布, 为同方差。
- White检验:将 对自变量的水平项、平方项和交叉乘积项作回归,能检测更广泛形式的异方差(包括非线性形式),但自由度消耗较大。
- Goldfeld-Quandt检验:将数据按某自变量排序后去除中间约20\%的观测值,比较两端子样本的残差平方和,构造 统计量。
补救措施
处理异方差性的方法主要有三类:加权最小二乘法(WLS)是根本性方法——若异方差形式已知,通过对每个观测值赋予权重 可恢复有效性,实践中常采用可行广义最小二乘法(FGLS)估计权重。当异方差形式未知时,异方差稳健标准误(White标准误,亦称Sandwich估计量)提供了最便捷的替代方案:OLS系数保持不变,仅使用 调整标准误,小样本修正版本(HC1、HC2、HC3)进一步改善了有限样本表现。此外,变量变换(如对因变量取对数 ,压缩大规模数据的变异幅度)和模型重新设定(引入二次项、交互项或改用对数线性模型)也可从根源上缓解异方差问题。
异方差性是应用计量经济学中最常见也最重要的数据问题之一。在现代实证研究规范中,汇报异方差稳健标准误已是一项标准稳健性检验程序,忽视异方差性被视为严重的方法论缺陷。理解其本质、掌握其检测与修正方法,是每位从事定量研究的经济学者和数据分析师的基本功。