ARTICLE

瓦尔德检验

瓦尔德检验 (Wald Test) 瓦尔德检验 (Wald Test) 是统计学和计量经济学中最常用的参数约束检验方法之一,由 Abraham Wald 于 1943 年提出。它与似然比检验 (Likelihood Ratio Test, LR) 和拉格朗日乘数检验 (Lagrange Multiplier Test, LM, 又称 Score Test)

浏览 0 更新 2025-11-24

瓦尔德检验 (Wald Test)

瓦尔德检验 (Wald Test) 是统计学计量经济学中最常用的参数约束检验方法之一,由 Abraham Wald 于 1943 年提出。它与似然比检验 (Likelihood Ratio Test, LR) 和拉格朗日乘数检验 (Lagrange Multiplier Test, LM, 又称 Score Test) 并称为经典三大检验,三者共同构成了最大似然估计框架下假设检验的理论基石。

三大检验的核心区别在于估计模型的量不同:瓦尔德检验仅需估计无约束模型(即不施加原假设限制);似然比检验需同时估计无约束与有约束模型;拉格朗日乘数检验仅需估计有约束模型。正因瓦尔德检验只需拟合无约束模型,它在计算上尤为便捷——大多数回归软件包默认报告的系数显著性 tt 检验和联合显著性 FF 检验均可视为瓦尔德检验的特例。

核心思想与数学形式

瓦尔德检验的基本逻辑直截了当:在无约束模型下估计参数,然后考察参数估计值是否显著偏离原假设所设定的值。若偏离足够大,则拒绝原假设。

θ\boldsymbol{\theta} 为模型的 kk 维参数向量,θ^\hat{\boldsymbol{\theta}} 为其最大似然估计量 (MLE)。原假设通常可表示为 qq 个参数约束:

H0:Rθ=rH_0: \mathbf{R}\boldsymbol{\theta} = \mathbf{r}

其中 R\mathbf{R} 为已知的 q×kq \times k 约束矩阵(秩为 qq),r\mathbf{r}qq 维已知向量。最常见的特例是检验单个系数是否为零:H0:θj=0H_0: \theta_j = 0,此时 R\mathbf{R} 为选择向量 ej\mathbf{e}_j'r=0\mathbf{r} = 0

瓦尔德统计量定义为约束偏差的二次型,以参数估计的协方差矩阵之逆为权重:

W=(Rθ^r)[RVar^(θ^)R]1W = (\mathbf{R}\hat{\boldsymbol{\theta}} - \mathbf{r})^{\top} \bigl[\mathbf{R} \cdot \widehat{\operatorname{Var}}(\hat{\boldsymbol{\theta}}) \cdot \mathbf{R}^{\top}\bigr]^{-1}

(R\mathbf{R}\hat{θ\boldsymbol{\theta}} - r\mathbf{r})

其中 Var^(θ^)\widehat{\operatorname{Var}}(\hat{\boldsymbol{\theta}}) 为参数估计的协方差矩阵估计量。在原假设成立且满足正则条件时,瓦尔德统计量依分布收敛于自由度为 qq卡方分布

Wdχ2(q)W \xrightarrow{d} \chi^2(q)

与三大检验的关系:几何直觉

三大检验可统一于轮廓似然 (Profile Likelihood) 的几何图像中。设 (θ)\ell(\boldsymbol{\theta}) 为对数似然函数:

  • 似然比检验 (LR):比较无约束估计与有约束估计处的对数似然值之差——LR=2[(θ^)(θ~)]LR = 2[\ell(\hat{\boldsymbol{\theta}}) - \ell(\tilde{\boldsymbol{\theta}})]。直接测量似然函数在两个估计值之间的"高度差"。
  • 瓦尔德检验 (W):在无约束估计 θ^\hat{\boldsymbol{\theta}} 处评估约束偏差——测量参数估计值与约束之间的距离,加权方式由似然函数的曲率决定。
  • 拉格朗日乘数检验 (LM):在有约束估计 θ~\tilde{\boldsymbol{\theta}} 处评估得分函数 (Score) 偏离零的程度——若原假设正确,得分函数在有约束估计处应接近零。

三者渐近等价(在大样本下均有相同的 χ2(q)\chi^2(q) 分布),但在有限样本中的表现不同。瓦尔德检验的一个实际优势是只需无约束模型,这在需要额外建模才能施加约束(如非线性约束)的场景中尤为便利。

线性回归中的应用

在经典线性回归模型 y=Xβ+ε\mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \boldsymbol{\varepsilon}εN(0,σ2I)\boldsymbol{\varepsilon} \sim N(\mathbf{0}, \sigma^2\mathbf{I}) 中,瓦尔德检验具有精确的有限样本分布(而非仅渐近成立)。检验线性约束 H0:Rβ=rH_0: \mathbf{R}\boldsymbol{\beta} = \mathbf{r} 的瓦尔德统计量为:

W=(Rβ^r)W = (\mathbf{R}\hat{\boldsymbol{\beta}} - \mathbf{r})^{\top}

\bigl[σ^2\hat{\sigma}^2 R\mathbf{R}(X\mathbf{X}^{\top}X\mathbf{X})^{-1}R\mathbf{R}^{\top}\bigr]^{-1} (R\mathbf{R}\hat{β\boldsymbol{\beta}} - r\mathbf{r})

在原假设下,除以约束个数并标准化后的统计量服从精确的F分布

F=WqF(q,nk)F = \frac{W}{q} \sim F(q, n - k)

软件回归输出中常见的单个系数 tt 检验 (q=1)(q=1) 和整体显著性的 FF 检验均是此形式的特例。Stata 中的 \texttt{test} 命令和 R 中 \texttt{car} 包的 \texttt{linearHypothesis()} 函数均默认报告瓦尔德检验。

非线性模型中的应用

瓦尔德检验的渐近性质使其在非线性模型中同样适用,如Logit模型Probit模型泊松回归生存分析中的Cox比例风险模型。在这些模型中,参数通过最大似然估计,协方差矩阵通常基于信息矩阵(观测信息矩阵或期望信息矩阵)或其稳健形式估计。

非线性约束下的一个经典例子是检验柯布-道格拉斯生产函数中规模报酬不变假设:对于模型 Y=AKβ1Lβ2eεY = A K^{\beta_1} L^{\beta_2} e^{\varepsilon},约束 H0:β1+β2=1H_0: \beta_1 + \beta_2 = 1 可通过 R=[0,1,1]\mathbf{R} = [0, 1, 1]r=1r = 1 直接检验。由于约束是线性的(在参数中),瓦尔德检验的形式不变。

稳健瓦尔德检验

当模型存在异方差聚类相关时,标准协方差矩阵估计不一致,瓦尔德检验的推断可能严重失真。解决方案是使用稳健标准误

Huber-White稳健标准误:替换协方差估计量为"三明治"形式:

Var^robust(θ^)=\widehat{\operatorname{Var}}_{\text{robust}}(\hat{\boldsymbol{\theta}}) =

H1\mathbf{H}^{-1} S\mathbf{S} H1\mathbf{H}^{-1} 其中 H\mathbf{H} 为 Hessian 矩阵,S\mathbf{S} 为得分函数外积和的期望。在异方差下仍给出一致的标准误估计。

聚类稳健标准误:当数据存在组内相关(如面板数据中的个体在不同时期的观测)时,将"三明治"中间项 S\mathbf{S} 替换为聚类层面的加总,允许同一聚类内的任意相关性。此时瓦尔德检验的自由度需根据聚类数量调整,或使用野生自助法 (Wild Bootstrap) 进行推断。

局限性与注意事项

瓦尔德检验并非完美,使用者需警惕若干陷阱:

  1. 参数化不变性问题:瓦尔德检验对参数的非线性变换不是不变的。例如,检验 θ=0\theta = 0 与检验 eθ=1e^{\theta} = 1 可能得出不同结论,而似然比检验自动避免此问题。实践中需谨慎选择参数化形式。
  2. Hauck-Donner效应:在非线性模型(尤其是 Logit/Probit)中,当参数真值远离零时,瓦尔德检验可能表现反常——即使系数显著不为零,瓦尔德统计量也可能偏向零,导致检验功效下降 (Hauck \& Donner, 1977)。此时似然比检验更为可靠。
  3. 边界约束:当原假设将参数置于参数空间的边界上(如检验方差分量是否为零)时,卡方渐近不再成立,需要专门的非标准分布理论。
  4. 弱工具变量:在工具变量回归中,若工具变量与内生变量的相关性很弱(第一阶段 FF 统计量小于 10),瓦尔德检验基于的标准误严重偏小,过度拒绝原假设。此时应使用弱工具变量稳健推断方法,如 Anderson-Rubin 检验或 Moreira 条件似然比检验。

与置信区间的关系

瓦尔德检验与置信区间之间存在精妙的对偶关系。参数 θj\theta_j(1α)(1-\alpha) 水平瓦尔德置信区间是所有不拒绝原假设 H0:θj=θj0H_0: \theta_j = \theta_{j0}θj0\theta_{j0} 的集合:

{θj0:(θ^jθj0)2Var^(θ^j)χ1,α2}\left\{ \theta_{j0}: \frac{(\hat{\theta}_j - \theta_{j0})^2}{\widehat{\operatorname{Var}}(\hat{\theta}_j)} \leq \chi^2_{1,\alpha} \right\}

由此直接给出熟知的对称区间 θ^j±zα/2SE(θ^j)\hat{\theta}_j \pm z_{\alpha/2} \cdot \operatorname{SE}(\hat{\theta}_j)。这种对偶性意味着:使用瓦尔德置信区间等价于进行瓦尔德检验,反之亦然。在渐近正态性成立的条件下,此区间构造是大样本中最便捷的方法,但同样继承了瓦尔德检验的局限性(如参数化非不变性和边界问题)。