ARTICLE
Breusch-Pagan检验
Breusch-Pagan 检验 (Breusch-Pagan Test) Breusch-Pagan 检验(Breusch-Pagan Test,简称 BP 检验)是计量经济学中用于检测线性回归模型异方差性(heteroskedasticity)的经典方法之一,由澳大利亚统计学家 Trevor Breusch 与 Adrian Pagan 于 1979 年
Breusch-Pagan 检验 (Breusch-Pagan Test)
Breusch-Pagan 检验(Breusch-Pagan Test,简称 BP 检验)是计量经济学中用于检测线性回归模型异方差性(heteroskedasticity)的经典方法之一,由澳大利亚统计学家 Trevor Breusch 与 Adrian Pagan 于 1979 年提出。异方差性是指回归误差项的方差不恒定,它违反了普通最小二乘法(OLS)中高斯-马尔可夫定理的核心前提——同方差假设。当异方差存在时,OLS 估计量虽仍保持无偏性和一致性,但不再具有最小方差性,即不再是BLUE(最佳线性无偏估计量)。更为严重的是,在异方差下 OLS 的标准误会变得有偏且不一致,从而使得基于标准误的t检验、F检验以及置信区间均失效。这将导致研究者可能对回归系数的统计显著性做出错误的推断。BP 检验在拉格朗日乘数(Lagrange Multiplier, LM)框架下为异方差诊断提供了系统且简洁的方法,是实证研究中必不可少的工具。
历史背景与理论提出
Breusch 与 Pagan 于 1979 年在 Econometrica 期刊上发表了题为 A Simple Test for Heteroscedasticity and Random Coefficient Variation 的论文。该论文提出的 LM 检验方法不仅适用于异方差检测,还可用于检验随机系数模型。同期,英国统计学家 R. Dennis Cook 和 Sanford Weisberg 也独立提出了类似的检验思路(即后来所称的 Cook-Weisberg 检验)。因此,BP 检验有时也被称为 Breusch-Pagan--Cook-Weisberg 检验。该检验的问世填补了异方差系统诊断工具的空白,成为了此后数十年实证研究中最为广泛采用的异方差检验方法之一。
检验原理与基本假设
考虑标准的线性回归模型:
其中 为被解释变量, 为 解释变量向量, 为系数向量, 为随机误差项。模型假定条件期望 。
原假设 为同方差,即:
这意味着所有观测值对应的误差项具有相同的方差。
备择假设设定误差方差依赖于某些外生变量 。通常 是 的子集或其函数变换(如平方项或对数变换):
其中 为某个可微函数,常用指数函数 以保证方差恒为正。检验原假设 等价于检验参数约束 。由于 BP 检验属于 LM 检验族,研究者只需在零假设下对原模型进行 OLS 估计,无需在备择假设下进行极大似然估计,因此计算上非常便捷。
具体检验步骤
\paragraph{第一步:OLS 回归。}对原模型进行 OLS 估计,得到残差序列:
\paragraph{第二步:构造标准化平方残差。}计算残差方差的估计值 (此处分母使用 而非 ,以满足 LM 检验的理论要求),然后构造标准化平方残差:
\paragraph{第三步:辅助回归。}将 对 (含截距项)进行辅助 OLS 回归:
记录该回归的解释平方和 或决定系数 。辅助回归的核心思想是考察残差平方的变异能否被 所解释。
\paragraph{第四步:计算 LM 统计量并做出判断。}构造 LM 统计量:
在原假设 下, 渐近服从自由度为 的卡方分布,记为 ,其中 为 中排除截距项后的变量个数。若计算得到的 统计量大于给定显著性水平 下的临界值 ,则拒绝同方差假设,认为存在异方差。
Koenker 学生化稳健版本
原始 BP 检验的一个关键缺陷是它依赖误差项服从正态分布的假设。当实际数据分布呈厚尾或偏斜时,检验的实际显著性水平往往大幅偏离名义水平,即容易出现过度拒绝的问题。为克服这一局限,Koenker(1981)在 Journal of Econometrics 上提出了学生化(studentized)稳健版本。该版本将辅助回归的因变量替换为:
其中 为平方残差的样本方差。该版本的 统计量仅要求误差项的四阶矩有限,即可保证渐近分布为 ,对正态性假设的依赖大幅减弱,因此在非正态误差下仍具有良好的有限样本性质。目前绝大多数计量软件——包括 Stata(\texttt{estat hettest})、R(\texttt{lmtest::bptest})以及 Python 的 \texttt{statsmodels}——均默认采用此学生化稳健版本而非原始版本。
与其他异方差检验方法的比较
White 检验由 Halbert White 于 1980 年提出,通过在辅助回归中包含所有解释变量的平方项和交叉项来捕捉任意形式的异方差。其优点在于无需指定 的具体形式,通用性极强;但代价是自由度随解释变量数量呈二次增长,在小样本下功效可能偏低。Goldfeld-Quandt 检验适用于误差方差随某个变量单调变化的情形,但需要预先确定排序变量和样本分割点,且仅适用于两分组的方差比较,应用范围有限。ARCH-LM 检验由 Engle(1982)提出,专门用于检测时间序列数据中的条件异方差即 ARCH 效应,是ARCH模型和GARCH模型建模前的标准诊断工具。相较而言,BP 检验在截面数据的通用异方差诊断中最常使用,自由度的消耗也最为经济。BP 检验与 White 检验的关系可以类比为定向检验与全向检验的关系:若 选择正确,BP 检验具有更高的检验功效;White 检验则更为自动化,无需研究者预设异方差的具体形式,但功效可能因自由度损失而有所分散。
实证应用与注意事项
BP 检验被广泛用于劳动经济学、教育经济学、健康经济学和金融经济学等实证领域。在实证研究中,BP 检验通常作为异方差的初步诊断工具:若检验不拒绝同方差假设,则可直接使用 OLS 及其标准误进行推断;若检验显著,则研究者需改用稳健标准误(如 Eicker-Huber-White 标准误)或加权最小二乘法(WLS)来获得可靠的统计推断。
在具体应用中应特别注意以下几点:第一,应优先使用 Koenker 学生化稳健版本,以避免对误差正态性假设的不必要依赖,这在金融数据等常见厚尾分布场景下尤为关键。第二,检验功效高度依赖于 的选择——若遗漏了真正影响误差方差的关键解释变量或其函数形式(如平方项、交互项),检验可能检测不到异方差的存在。第三,在大样本情形下,BP 检验可能对各种微小的方差波动均高度敏感,即使异方差程度轻微到对估计效率无实际影响,也容易导致统计显著的检验结果。因此,研究者不应机械地依赖检验的 值结论,而应结合残差图、QQ图和散点图等可视化诊断工具,以及经济学意义上的实质性判断,进行综合评估。此外,BP 检验的设定也可能受到模型设定错误(如遗漏变量、函数形式错误)的影响,因此在检验异方差之前,应首先确保模型的整体设定是合理的。尽管存在上述局限,BP 检验凭借其简单直观的构造、严格的渐近理论基础以及便捷的软件实现,至今仍是计量经济学和应用经济学中异方差诊断不可或缺的基准工具。