ARTICLE
瓦尔德检验
瓦尔德检验 (Wald Test) 瓦尔德检验 (Wald Test) 是统计学和计量经济学中最常用的参数约束检验方法之一,由 Abraham Wald 于 1943 年提出。它与似然比检验 (Likelihood Ratio Test, LR) 和拉格朗日乘数检验 (Lagrange Multiplier Test, LM, 又称 Score Test)
瓦尔德检验 (Wald Test)
瓦尔德检验 (Wald Test) 是统计学和计量经济学中最常用的参数约束检验方法之一,由 Abraham Wald 于 1943 年提出。它与似然比检验 (Likelihood Ratio Test, LR) 和拉格朗日乘数检验 (Lagrange Multiplier Test, LM, 又称 Score Test) 并称为经典三大检验,三者共同构成了最大似然估计框架下假设检验的理论基石。
三大检验的核心区别在于估计模型的量不同:瓦尔德检验仅需估计无约束模型(即不施加原假设限制);似然比检验需同时估计无约束与有约束模型;拉格朗日乘数检验仅需估计有约束模型。正因瓦尔德检验只需拟合无约束模型,它在计算上尤为便捷——大多数回归软件包默认报告的系数显著性 检验和联合显著性 检验均可视为瓦尔德检验的特例。
核心思想与数学形式
瓦尔德检验的基本逻辑直截了当:在无约束模型下估计参数,然后考察参数估计值是否显著偏离原假设所设定的值。若偏离足够大,则拒绝原假设。
设 为模型的 维参数向量, 为其最大似然估计量 (MLE)。原假设通常可表示为 个参数约束:
其中 为已知的 约束矩阵(秩为 ), 为 维已知向量。最常见的特例是检验单个系数是否为零:,此时 为选择向量 ,。
瓦尔德统计量定义为约束偏差的二次型,以参数估计的协方差矩阵之逆为权重:
(\hat{} - )
其中 为参数估计的协方差矩阵估计量。在原假设成立且满足正则条件时,瓦尔德统计量依分布收敛于自由度为 的卡方分布:
与三大检验的关系:几何直觉
三大检验可统一于轮廓似然 (Profile Likelihood) 的几何图像中。设 为对数似然函数:
- 似然比检验 (LR):比较无约束估计与有约束估计处的对数似然值之差——。直接测量似然函数在两个估计值之间的"高度差"。
- 瓦尔德检验 (W):在无约束估计 处评估约束偏差——测量参数估计值与约束之间的距离,加权方式由似然函数的曲率决定。
- 拉格朗日乘数检验 (LM):在有约束估计 处评估得分函数 (Score) 偏离零的程度——若原假设正确,得分函数在有约束估计处应接近零。
三者渐近等价(在大样本下均有相同的 分布),但在有限样本中的表现不同。瓦尔德检验的一个实际优势是只需无约束模型,这在需要额外建模才能施加约束(如非线性约束)的场景中尤为便利。
线性回归中的应用
在经典线性回归模型 , 中,瓦尔德检验具有精确的有限样本分布(而非仅渐近成立)。检验线性约束 的瓦尔德统计量为:
\bigl[ ()^{-1}\bigr]^{-1} (\hat{} - )
在原假设下,除以约束个数并标准化后的统计量服从精确的F分布:
软件回归输出中常见的单个系数 检验 和整体显著性的 检验均是此形式的特例。Stata 中的 \texttt{test} 命令和 R 中 \texttt{car} 包的 \texttt{linearHypothesis()} 函数均默认报告瓦尔德检验。
非线性模型中的应用
瓦尔德检验的渐近性质使其在非线性模型中同样适用,如Logit模型、Probit模型、泊松回归和生存分析中的Cox比例风险模型。在这些模型中,参数通过最大似然估计,协方差矩阵通常基于信息矩阵(观测信息矩阵或期望信息矩阵)或其稳健形式估计。
非线性约束下的一个经典例子是检验柯布-道格拉斯生产函数中规模报酬不变假设:对于模型 ,约束 可通过 , 直接检验。由于约束是线性的(在参数中),瓦尔德检验的形式不变。
稳健瓦尔德检验
当模型存在异方差或聚类相关时,标准协方差矩阵估计不一致,瓦尔德检验的推断可能严重失真。解决方案是使用稳健标准误:
Huber-White稳健标准误:替换协方差估计量为"三明治"形式:
其中 为 Hessian 矩阵, 为得分函数外积和的期望。在异方差下仍给出一致的标准误估计。
聚类稳健标准误:当数据存在组内相关(如面板数据中的个体在不同时期的观测)时,将"三明治"中间项 替换为聚类层面的加总,允许同一聚类内的任意相关性。此时瓦尔德检验的自由度需根据聚类数量调整,或使用野生自助法 (Wild Bootstrap) 进行推断。
局限性与注意事项
瓦尔德检验并非完美,使用者需警惕若干陷阱:
- 参数化不变性问题:瓦尔德检验对参数的非线性变换不是不变的。例如,检验 与检验 可能得出不同结论,而似然比检验自动避免此问题。实践中需谨慎选择参数化形式。
- Hauck-Donner效应:在非线性模型(尤其是 Logit/Probit)中,当参数真值远离零时,瓦尔德检验可能表现反常——即使系数显著不为零,瓦尔德统计量也可能偏向零,导致检验功效下降 (Hauck \& Donner, 1977)。此时似然比检验更为可靠。
- 边界约束:当原假设将参数置于参数空间的边界上(如检验方差分量是否为零)时,卡方渐近不再成立,需要专门的非标准分布理论。
- 弱工具变量:在工具变量回归中,若工具变量与内生变量的相关性很弱(第一阶段 统计量小于 10),瓦尔德检验基于的标准误严重偏小,过度拒绝原假设。此时应使用弱工具变量稳健推断方法,如 Anderson-Rubin 检验或 Moreira 条件似然比检验。
与置信区间的关系
瓦尔德检验与置信区间之间存在精妙的对偶关系。参数 的 水平瓦尔德置信区间是所有不拒绝原假设 的 的集合:
由此直接给出熟知的对称区间 。这种对偶性意味着:使用瓦尔德置信区间等价于进行瓦尔德检验,反之亦然。在渐近正态性成立的条件下,此区间构造是大样本中最便捷的方法,但同样继承了瓦尔德检验的局限性(如参数化非不变性和边界问题)。