ARTICLE

布罗施-培根检验 (Breusch-Pagan Test)

布罗施-培根检验 (Breusch-Pagan Test) 布罗施-培根检验 (Breusch-Pagan Test),简称 BP 检验,是由澳大利亚经济学家 Trevor S. Breusch 与 Adrian R. Pagan 于 1979 年在期刊 Econometrica 上发表的论文 A Simple Test for Heteroscedasti

浏览 0 更新 2025-10-26

布罗施-培根检验 (Breusch-Pagan Test)

布罗施-培根检验 (Breusch-Pagan Test),简称 BP 检验,是由澳大利亚经济学家 Trevor S. Breusch 与 Adrian R. Pagan 于 1979 年在期刊 Econometrica 上发表的论文 A Simple Test for Heteroscedasticity and Random Coefficient Variation 中提出的一种用于检测线性回归模型中 异方差性 (Heteroskedasticity) 的统计检验方法。该检验属于 拉格朗日乘数检验 (Lagrange Multiplier Test, LM Test) 家族,其核心思想简明而深刻:若误差项方差为常数(即满足同方差假设),则残差平方不应与解释变量存在系统性关联;反之,若残差平方的变异能够被某些可观测变量显著解释,则构成了异方差存在的有力证据。

理论背景与动机

普通最小二乘法 (OLS) 的经典 Gauss-Markov 假设中,误差项 εi\varepsilon_i 需满足 同方差性 (Homoskedasticity):即 Var(εixi)=σ2\operatorname{Var}(\varepsilon_i \mid \mathbf{x}_i) = \sigma^2 对所有观测 ii 恒定。当这一假设不成立时,OLS 估计量虽然仍然保持无偏性与一致性,但不再具有 有效性 (Efficiency),即其方差不再达到 Cramér-Rao 下界。更为严峻的是,OLS 默认输出的标准误估计将产生系统性偏误,导致常规的 t 检验与 F 检验不再可靠——研究者可能错误地拒绝或接受原假设,从而得出误导性结论。BP 检验提供了一种系统化的诊断工具,使实证研究者能够在回归分析中及时识别异方差问题,进而采取适当的补救措施,如使用 加权最小二乘法 (WLS) 或 异方差稳健标准误 (Heteroskedasticity-Robust Standard Errors)。

假设设定与检验框架

考虑标准线性回归模型:

yi=xiβ+εi,i=1,,ny_i = \mathbf{x}_i'\boldsymbol{\beta} + \varepsilon_i, \quad i = 1, \ldots, n

其中 xi\mathbf{x}_ik×1k \times 1 的解释变量向量(通常包含常数项)。BP 检验假设误差方差由一组外生变量 zi\mathbf{z}_i 决定,其函数形式为:

Var(εixi)=σ2h(ziγ)\operatorname{Var}(\varepsilon_i \mid \mathbf{x}_i) = \sigma^2 \cdot h(\mathbf{z}_i'\boldsymbol{\gamma})

其中 zi\mathbf{z}_ip×1p \times 1 的变量向量(通常选取自 xi\mathbf{x}_i 的子集或其非线性变换,但不包括常数项),h()h(\cdot) 为满足 h(0)=1h(0) = 1 且二阶可微的严格正函数(最常用的设定是 h(t)=eth(t) = e^th(t)=1+th(t) = 1 + t)。由此,原假设与备择假设可简洁地表述为:

H0:γ=0Var(εi)=σ2(同方差)H1:γ0Var(εi) 随 zi 变化(异方差)\begin{aligned} H_0 &: \boldsymbol{\gamma} = \mathbf{0} \quad \Rightarrow \quad \operatorname{Var}(\varepsilon_i) = \sigma^2 \quad \text{(同方差)} \\ H_1 &: \boldsymbol{\gamma} \neq \mathbf{0} \quad \Rightarrow \quad \operatorname{Var}(\varepsilon_i) \text{ 随 } \mathbf{z}_i \text{ 变化} \quad \text{(异方差)} \end{aligned}

该设定将异方差检验转化为对辅助参数向量 γ\boldsymbol{\gamma} 是否为零的检验,从而可以借助 LM 检验原理构造检验统计量。

检验步骤与统计量构造

BP 检验的操作流程如下:

  1. 对原模型 yi=xiβ+εiy_i = \mathbf{x}_i'\boldsymbol{\beta} + \varepsilon_i 执行 OLS 估计,获得残差序列 ei=yixiβ^e_i = y_i - \mathbf{x}_i'\hat{\boldsymbol{\beta}}
  2. 计算残差方差的最大似然估计(在正态性假设下):σ~2=1ni=1nei2\tilde{\sigma}^2 = \frac{1}{n}\sum_{i=1}^{n} e_i^2
  3. 构造标准化残差平方:gi=ei2/σ~2g_i = e_i^2 / \tilde{\sigma}^2
  4. gig_i 为被解释变量,对 zi\mathbf{z}_i(包含常数项)进行辅助回归,获得该回归的解释平方和 ESS。
  5. 计算 LM 检验统计量: \[ \text{LM} = \frac{\text{ESS}}{2} \]
  6. 在大样本条件下,若 H0H_0 成立,则 LMdχ2(p)\text{LM} \xrightarrow{d} \chi^2(p),其中 ppzi\mathbf{z}_i 中变量的个数(不含常数项)。若 LM>χ1α2(p)\text{LM} > \chi^2_{1-\alpha}(p),则在显著性水平 α\alpha 下拒绝同方差的原假设。

等价地,检验统计量也可表示为 nR2nR^2 的形式:LM=nRg2\text{LM} = n \cdot R^2_g,其中 Rg2R^2_g 为辅助回归 gizig_i \sim \mathbf{z}_i 的非中心决定系数。这一形式直观地表明:若残差平方的变异能够被 zi\mathbf{z}_i 大幅解释(即 Rg2R^2_g 较高),则异方差的可能性越大。

Koenker-Bassett 稳健变体

上述标准 BP 检验在推导 LM 统计量时依赖误差项正态分布的假设。当实际数据偏离正态性时(例如呈现厚尾或偏态),检验的有限样本性质可能恶化,导致实际显著性水平偏离名义水平。为克服这一局限,Koenker (1981) 提出了一个对非正态性更为稳健的变体,通常称为 Koenker-Bassett 检验studentized Breusch-Pagan 检验。其将辅助回归的被解释变量替换为:

gi=ei2σ~21g_i^* = \frac{e_i^2}{\tilde{\sigma}^2} - 1

并直接使用该辅助回归的 ESS(或等价地,nR2nR^2)作为检验统计量。在大样本下,该统计量仍服从 χ2(p)\chi^2(p) 分布,但对非正态误差表现出更好的稳健性。实证应用中,建议同时报告原始 BP 检验与 Koenker 稳健版本的检验结果,以便读者评估结论对分布假设的敏感性。

与其他异方差检验的比较

异方差检验是计量经济学中的经典议题,除 BP 检验外,尚有若干常用方法:

  • 怀特检验 (White Test):由 Halbert White 于 1980 年提出,最为一般化——其对异方差形式不做任何参数假设,在辅助回归中纳入所有解释变量的水平项、平方项及交叉项。优点是覆盖面广,能够检测任意形式的异方差;缺点是自由度消耗巨大(若原模型有 kk 个解释变量,辅助回归参数数量为 O(k2)O(k^2)),在小样本中检验功效 (statistical power) 通常不如 BP 检验。
  • 戈德菲尔德-匡特检验 (Goldfeld-Quandt Test):适用于异方差与某一解释变量呈单调关系的场景,需将样本按该变量排序后分为高、低两组分别估计方差并进行 F 检验。其局限在于只能检测单一维度的异方差模式,且对分组方式的选取敏感。
  • BP 检验的定位:BP 检验在一般性与统计功效之间取得了良好的平衡。当研究者对异方差的潜在来源具有先验知识(即可有针对性地指定 zi\mathbf{z}_i),BP 检验比 White 检验更聚焦、自由度损失更小,因而在大多实证研究中被广泛推荐为首选工具。

应用建议与注意事项

  1. BP 检验是 大样本检验,其理论依据是 LM 统计量的渐近分布。当样本量较小(如 n<50n < 50)时,渐近近似可能不够精确,应结合图形诊断(如残差散点图)综合判断。
  2. zi\mathbf{z}_i 的选择是检验成败的关键。若遗漏了真正驱动异方差的变量,检验可能完全失效(功效趋近于零);若包含过多无关变量,则自由度损失导致功效下降。实践中通常选择可能影响方差的核心解释变量,亦可通过 Box-Cox 变换 后的变量或预测值的多项式作为备选。
  3. 建议始终同时报告 Koenker 稳健版本的结果,以规避正态性假设可能带来的误判。
  4. 若 BP 检验拒绝原假设,表明存在异方差,可采取的补救措施包括:使用 加权最小二乘法 (WLS) 进行有效估计、使用 Huber-White 异方差稳健标准误进行推断、或通过变量变换(如对数变换)来稳定方差。
  5. BP 检验仅针对异方差问题,无法检测 自相关 (Autocorrelation) ——后者应使用 Durbin-Watson 检验Breusch-Godfrey 检验 进行诊断。在时间序列回归中,异方差与自相关常同时存在,需分别检验。
  6. 该检验假定条件均值函数已正确设定。若回归模型本身存在遗漏变量或函数形式误设,则 BP 检验可能错误地指示异方差,实则是对模型设定偏误的间接反映。