ARTICLE

Wilks定理

Wilks定理 (Wilks' Theorem) Wilks定理,全称威尔克斯似然比检验定理,是数理统计学中关于假设检验的一个根本性成果。该定理为似然比检验(Likelihood-Ratio Test, LRT)统计量的抽样分布提供了一个至关重要的渐近近似结果:在零假设成立的条件下,当样本量足够大时,似然比检验统计量近似服从卡方分布。这使得研究者无需为每种具

浏览 2 更新 2025-11-24

Wilks定理 (Wilks' Theorem)

Wilks定理,全称威尔克斯似然比检验定理,是数理统计学中关于假设检验的一个根本性成果。该定理为似然比检验(Likelihood-Ratio Test, LRT)统计量的抽样分布提供了一个至关重要的渐近近似结果:在零假设成立的条件下,当样本量足够大时,似然比检验统计量近似服从卡方分布。这使得研究者无需为每种具体情况推导复杂的精确分布,可直接使用标准卡方分布进行统计推断。该定理由统计学家Samuel S. Wilks于1938年提出。

定理的正式表述

考虑嵌套模型的检验场景:零假设H0:θΘ0H_0: \theta \in \Theta_0(参数受约束)对备择假设H1:θΘΘ0H_1: \theta \in \Theta \setminus \Theta_0(参数不受约束)。基于观测数据xx似然函数L(θx)L(\theta|x),在完整参数空间Θ\Theta中求MLEθ^\hat{\theta}L(θ^x)L(\hat{\theta}|x),在约束子空间Θ0\Theta_0中求MLEθ^0\hat{\theta}_0L(θ^0x)L(\hat{\theta}_0|x)。构造似然比检验统计量:

D=2ln(L(θ^0x)L(θ^x))=2[lnL(θ^x)lnL(θ^0x)]D = -2 \ln \left( \frac{L(\hat{\theta}_0|x)}{L(\hat{\theta}|x)} \right) = 2 \left[ \ln L(\hat{\theta}|x) - \ln L(\hat{\theta}_0|x) \right]

Wilks定理指出:在H0H_0为真且满足正则条件时,随着样本量nn \to \inftyDdχk2D \xrightarrow{d} \chi^2_k,其中自由度k=dim(Θ)dim(Θ0)k = \dim(\Theta) - \dim(\Theta_0)为完整参数空间与零假设子空间的自由参数维度之差。

直觉解释与正则条件

似然比L(θ^0x)/L(θ^x)L(\hat{\theta}_0|x)/L(\hat{\theta}|x)衡量零假设约束对数据拟合优度的影响——比值在(0,1](0, 1]区间。当H0H_0为真时约束不损害解释力,θ^0θ^\hat{\theta}_0 \approx \hat{\theta},比值趋近于1,D趋近于0。当H0H_0为假时约束严重妨碍拟合,比值趋近于0,D为大的正数。自由度k精确量化了零假设施加的独立约束数量——例如检验两个回归系数是否同时为零则k=2。2ln()-2\ln(\cdot)变换是该定理的精髓:通过对数和乘-2的操作,似然比的复杂分布在大样本下转化为标准卡方分布。

该定理的成立依赖正则条件:模型必须嵌套(零假设模型是备择假设模型的特例);真实参数值不能位于参数空间边界上(边界问题如检验H0:σ2=0H_0: \sigma^2=0)会导致D的分布不再是标准卡方;似然函数需关于参数足够平滑且参数可识别费雪信息矩阵需正定。在标准的广义线性模型、线性回归和逻辑斯蒂回归等模型中这些条件通常满足。

应用与比较

Wilks定理是三大渐近检验定理的核心成员,与沃尔德检验(Wald Test)和拉格朗日乘数检验(LM检验或称得分检验)构成经典渐近检验的三位一体。三者在零假设下具有相同的渐近分布(χk2\chi^2_k),但在有限样本中的表现和应用场景有所不同:Wald检验仅需无约束模型的MLE、计算简便;LM检验仅需约束模型的MLE,在约束模型更易估计时适用;LRT需同时估计两种模型,在三者中有限样本表现通常最优但计算成本最高。三者关系可通过似然函数在参数空间中的曲率直观理解。

在实践中应用Wilks定理的步骤为:分别拟合约束与无约束模型;计算D统计量;根据自由度k和显著性水平α\alpha确定临界值或计算p值;做出是否拒绝零假设的判断。Wilks定理以简洁明了的渐近理论为现代参数推断提供了统计假设检验的统一框架,在许多领域的嵌套模型比较中有广泛应用。