ARTICLE

得分检验

得分检验 (Score Test) 得分检验 (Score Test),又称 拉格朗日乘数检验 (Lagrange Multiplier Test, LM Test) 或 Rao 得分检验 (Rao's Score Test),是假设检验中与 似然比检验 (Likelihood Ratio Test) 和 Wald检验 (Wald Test) 并称的三大经典

浏览 0 更新 2025-11-24

得分检验 (Score Test)

得分检验 (Score Test),又称 拉格朗日乘数检验 (Lagrange Multiplier Test, LM Test) 或 Rao 得分检验 (Rao's Score Test),是假设检验中与 似然比检验 (Likelihood Ratio Test) 和 Wald检验 (Wald Test) 并称的三大经典检验方法之一。得分检验的核心思想是:仅利用在原假设 H0H_0 下估计的受限模型信息,通过考察 得分函数 (Score Function) 在原假设约束下的行为来判断是否拒绝 H0H_0,而无须估计无约束的备择模型。

定义与构造原理

设独立同分布样本 X1,X2,,XnX_1, X_2, \ldots, X_n 来自参数分布族 {f(x;θ):θΘRp}\{f(x; \theta) : \theta \in \Theta \subset \mathbb{R}^p\},对数似然函数为 (θ)=i=1nlogf(xi;θ)\ell(\theta) = \sum_{i=1}^{n} \log f(x_i; \theta)。考虑检验问题:

H0:θ=θ0vsH1:θθ0H_0: \theta = \theta_0 \quad \text{vs} \quad H_1: \theta \neq \theta_0

定义 得分函数 (Score Function) 为对数似然关于参数的一阶导数向量:

s(θ)=(θ)θs(\theta) = \frac{\partial \ell(\theta)}{\partial \theta}

得分函数在真实参数处的期望为零,即 Eθ[s(θ)]=0\mathbb{E}_{\theta}[s(\theta)] = 0,这是似然理论的基本性质。若 H0H_0 成立,则 s(θ0)s(\theta_0) 应在零附近波动;若 s(θ0)s(\theta_0) 显著偏离零,则构成拒绝 H0H_0 的证据。

定义 Fisher 信息矩阵 (Fisher Information Matrix):

I(θ)=Eθ[2(θ)θθT]I(\theta) = -\mathbb{E}_{\theta}\left[ \frac{\partial^2 \ell(\theta)}{\partial \theta \partial \theta^T} \right]

或使用观测信息矩阵 J(θ)=2(θ)θθT\mathcal{J}(\theta) = -\frac{\partial^2 \ell(\theta)}{\partial \theta \partial \theta^T} 作为其样本对应量。在适当正则条件下,原假设成立时得分函数渐近服从多元正态分布:

s(θ0)dN(0,I(θ0))s(\theta_0) \xrightarrow{d} N(0, I(\theta_0))

由此构造 得分检验统计量

S=s(θ^0)T[I(θ^0)]1s(θ^0)S = s(\hat{\theta}_0)^T [I(\hat{\theta}_0)]^{-1} s(\hat{\theta}_0)

其中 θ^0\hat{\theta}_0 是在 H0H_0 约束下的 最大似然估计 (MLE)。在原假设下,Sdχp2S \xrightarrow{d} \chi^2_p,自由度为约束的个数 pp。亦可等价使用观测信息矩阵替代期望信息矩阵,统计量形式为:

S=s(θ^0)T[J(θ^0)]1s(θ^0)S = s(\hat{\theta}_0)^T [\mathcal{J}(\hat{\theta}_0)]^{-1} s(\hat{\theta}_0)

在复合原假设 H0:g(θ)=0H_0: g(\theta) = 0(其中 g:RpRrg: \mathbb{R}^p \to \mathbb{R}^rrr 个光滑约束函数)的情形下,引入拉格朗日乘数 λ\lambda 构造拉格朗日函数 (θ)+λTg(θ)\ell(\theta) + \lambda^T g(\theta),得分检验统计量可在受限 MLE θ^0\hat{\theta}_0 处通过一阶条件直接计算,此时统计量渐近服从 χr2\chi^2_r

与 Wald 检验和似然比检验的比较

三大检验之间存在明确的几何关系与渐近等价性。考虑简单原假设 H0:θ=θ0H_0: \theta = \theta_0

  • Wald检验:基于无约束 MLE θ^\hat{\theta}θ0\theta_0 的距离,统计量 W=(θ^θ0)TI(θ^)(θ^θ0)W = (\hat{\theta} - \theta_0)^T I(\hat{\theta}) (\hat{\theta} - \theta_0)。需要估计无约束模型。
  • 似然比检验:基于约束与无约束对数似然的差值,统计量 LR=2[(θ^)(θ^0)]LR = 2[\ell(\hat{\theta}) - \ell(\hat{\theta}_0)]。需要同时估计约束和无约束模型。
  • 得分检验:仅基于约束模型的得分函数与信息矩阵。只需估计约束模型。

H0H_0 下三者渐近等价,即 SW=op(1)S - W = o_p(1)SLR=op(1)S - LR = o_p(1),均收敛于 χp2\chi^2_p。但在有限样本下,三者的表现可能存在差异。一般而言,似然比检验在有限样本下表现出较好的水平性质,而得分检验在局部备择假设下有时具有更高的功效。

得分检验的一个核心优势在于其 计算简便性:当备择模型较为复杂(例如涉及非线性约束或高维参数)而原假设下的受限模型相对简单时,得分检验仅需拟合受限模型,避免了在备择空间中搜索 MLE 的高昂计算代价。这一特性使其在模型诊断和模型选择中被广泛采用。

重要应用

模型误设检验

得分检验在计量经济学中被大量用于检验模型设定是否正确,而其构造往往基于辅助回归 (Auxiliary Regression),无须迭代估计复杂备择模型。典型例子包括:

  1. 异方差检验Breusch-Pagan检验 本质上即为得分检验,在原假设(同方差)下检验残差平方是否与解释变量相关。其检验统计量通过将 OLS 残差平方对解释变量做辅助回归的 nR2nR^2 构造。
  2. 自相关检验Durbin-Watson检验 在特定条件下可视为得分检验的一种近似形式。更直接的得分检验版本通过辅助回归检验残差滞后项的显著性。
  3. 正态性检验Jarque-Bera检验 基于偏度和峰度的得分贡献构造检验统计量。
  4. 遗漏变量检验 (Variable Addition Test / RESET):在原假设模型残差对额外解释变量(包括拟合值的高次幂)回归时,相应的 LM 统计量即为得分检验。

面板数据与时间序列

面板数据 模型中,得分检验常用于判断是否应在随机效应与混合 OLS 之间选择更为复杂的设定。例如 Breusch-Pagan LM 检验 检验个体效应的方差是否为零,从而决定是否拒绝混合回归而采用随机效应模型。在 ARMA 模型定阶、GARCH 效应检验中,得分检验(即 Engle 的 ARCH-LM 检验)通过在原假设(无异方差)下检验残差平方的自相关性,为识别条件异方差的存在提供了标准工具。

空间计量与网络分析

空间计量经济学 中,得分检验被用于检验空间自相关(如检验空间误差模型或空间滞后模型中的空间参数是否为零),其统计量在空间权重矩阵给定下可通过 OLS 残差计算。类似思想也适用于社会网络分析中同群效应 (Peer Effects) 的检验。

理论渊源

得分检验由印度统计学家 C. R. Rao 于 1948 年在其奠基性论文中提出,故在国际文献中常被称为 Rao 得分检验。同一统计量在计量经济学文献中因与约束优化的拉格朗日方法在结构上的对应关系而被称为 拉格朗日乘数检验。Rao 的贡献构成了现代渐近推断理论的基石之一,与 Neyman-Pearson引理Wald 的工作共同塑造了频率学派假设检验的完整框架。

局限性与注意事项

  1. 对信息矩阵估计的敏感性:得分检验需要估计信息矩阵 I(θ0)I(\theta_0)J(θ0)\mathcal{J}(\theta_0)。在小样本下,信息矩阵的不同估计方式(期望信息 vs 观测信息 vs 稳健信息矩阵)可能导致检验结论差异显著。White 提出的稳健协方差矩阵估计可在一定程度上缓解此问题。
  2. 渐近性质的有限样本偏差:与 Wald 和 LR 检验类似,得分检验在小样本下可能出现严重的水平扭曲 (Size Distortion),即实际第一类错误概率偏离名义显著性水平。Bootstrap 方法可用于改善小样本性质。
  3. 对原假设空间的依赖性:若原假设位于参数空间的边界上(例如方差分量为零的原假设),经典渐近理论失效,需使用混合 χ2\chi^2 分布或自助法进行修正。
  4. 局部最优性而非全局性:得分检验是局部检验,对接近原假设的局部备择方案功效较高,但可能无法有效检测远离原假设的非局部备择。

尽管存在上述局限,得分检验因其仅需在原假设下拟合模型的独特优势,在模型诊断、变量选择、模型比较等场景中仍占据不可替代的位置。在实际应用中,研究者常根据计算可行性与检验目标在三类检验之间做出选择,并建议在条件允许时综合报告 Wald、LR 和 Score 三种检验的结果以增强结论的稳健性。