ARTICLE

LRT

LRT(似然比检验) 似然比检验(Likelihood Ratio Test, LRT)是统计学中一种基于似然函数进行假设检验的通用方法。由统计学家耶日·内曼和卡尔·皮尔逊于1928年系统提出,该检验通过比较两个嵌套模型的似然值来判断更复杂的模型是否显著优于简化模型。与沃尔德检验和拉格朗日乘子检验并称为"三大渐近检验",LRT广泛应用于回归分析、结构方程模型

浏览 3 更新 2025-10-26

LRT(似然比检验)

似然比检验(Likelihood Ratio Test, LRT)是统计学中一种基于似然函数进行假设检验的通用方法。由统计学家耶日·内曼和卡尔·皮尔逊于1928年系统提出,该检验通过比较两个嵌套模型的似然值来判断更复杂的模型是否显著优于简化模型。与沃尔德检验和拉格朗日乘子检验并称为"三大渐近检验",LRT广泛应用于回归分析、结构方程模型、遗传学、机器学习等诸多领域的模型选择与统计推断。

基本思想

LRT的核心思想建立在最大似然估计的基础之上。若一个简化模型(对应于零假设 H₀)正确描述了数据生成过程,那么该模型的最大似然值与更一般的备择模型(对应于备择假设 H₁)的最大似然值之间不应存在显著差异。换言之,对数据施加约束(即采用简化模型)所付出的"似然代价"应当足够小。似然比本身反映了数据支持两个模型的相对证据强度——比值越趋近于1,说明简化模型越充分;比值显著偏离1,则表明简化模型不恰当地丢弃了重要解释力。

检验统计量及其分布

对于零假设 H₀ 和备择假设 H₁,其中 H₀ 是 H₁ 的一个特例(即通过施加参数约束得到),定义似然比统计量:

Λ=supθΘ0L(θx)supθΘL(θx)\Lambda = \frac{\sup_{\theta \in \Theta_0} L(\theta \mid x)}{\sup_{\theta \in \Theta} L(\theta \mid x)}

其中 Θ0Θ\Theta_0 \subset \Theta 是零假设下的参数空间,Θ\Theta 是备择假设下的无约束参数空间。L(θx)L(\theta \mid x) 为给定数据 xx 下的似然函数。由于直接使用 Λ\Lambda 的分布难以处理,实践中常用对数变换形式:

D=2lnΛ=2[lnL(θ^0)lnL(θ^1)]D = -2\ln\Lambda = -2\left[\ln L(\hat{\theta}_0) - \ln L(\hat{\theta}_1)\right]

其中 θ^0\hat{\theta}_0θ^1\hat{\theta}_1 分别为约束模型和无约束模型的最大似然估计量。在内曼-皮尔逊引理框架下,当样本量趋于无穷且零假设成立时,统计量 DD 依分布收敛于自由度为 kk 的卡方分布 χ2(k)\chi^2(k),其中 k=dim(Θ)dim(Θ0)k = \dim(\Theta) - \dim(\Theta_0) 为两个模型参数个数之差。这一渐近结果使得LRT在应用中只需计算卡方值并与临界值比较即可做出判断。

理论性质与条件

  1. 渐近最优性:在一定的正则条件(如参数可识别、似然函数光滑、Fisher信息矩阵非奇异)下,LRT是一致最大功效检验的渐近等价实现,即在大样本下具有最优的检验功效。
  1. 嵌套模型要求:LRT要求两个模型严格嵌套——简化模型必须是通过对一般模型的参数施加约束(通常是将某些参数固定为零或相等)得到。非嵌套模型无法直接使用LRT比较。
  1. 大样本依赖:精确的有限样本分布通常未知,实践中依赖卡方近似。小样本情况下,LRT的显著性水平可能出现膨胀,此时可借助参数bootstrap或模拟方法来校准临界值。
  1. 边界参数问题:当零假设对应的参数位于参数空间边界时(例如检验方差是否为零、随机效应是否存在于混合模型中),卡方近似的标准条件不再成立,检验统计量的渐近分布变为混合卡方分布(chi-bar-squared distribution)。这一问题在方差分量检验和单侧假设检验中尤为突出。
  1. 正则条件的敏感性:若数据不独立同分布、似然函数设定错误、或存在冗余参数,LRT的渐近性质可能严重退化,导致错误推断。

与沃尔德检验和LM检验的关系

LRT、沃尔德检验(Wald Test)和拉格朗日乘子检验(Lagrange Multiplier Test,又称得分检验)构成统计假设检验的三大支柱。三者在大样本下渐近等价,但在有限样本和计算成本上各有不同:

  • 沃尔德检验:仅需估计无约束模型,检验基于参数估计值与其渐近方差。计算简便,但统计量在非线性约束下对参数化方式敏感。
  • LM检验:仅需估计约束模型,检验基于约束估计点处的得分向量。计算量最小,适合在估计简化模型后快速判断是否需要添加复杂结构。
  • 似然比检验:需同时估计两个模型,计算成本最高,但通常具有更好的有限样本性质,且对参数变换保持不变性。

在广义线性模型中,偏差统计量本质上是LRT在GLM框架下的推广;在结构方程模型中,模型拟合的卡方检验也是LRT的直接应用。

典型应用场景

  1. 回归模型比较:判断增加交互项、二次项或多项式项是否显著改善模型拟合。例如,在多元线性回归中比较含交互作用的模型与主效应模型。
  1. 基因关联分析:在全基因组关联研究(GWAS)中,比较包含与不包含特定遗传变异的逻辑回归模型,以判断单核苷酸多态性(SNP)是否与疾病表型显著关联。
  1. 因子分析:检验模型中提取的因子数是否足够——比较k个因子模型与k+1个因子模型,若LRT不显著则认为k个因子已足够解释数据协方差结构。
  1. 混合效应模型:检验随机截距或随机斜率是否显著,需注意边界参数问题——零假设对应方差分量为零,标准的卡方近似需要使用50:50混合卡方分布修正。
  1. 时间序列分析:在ARMA(p,q)模型中比较不同阶数的选择,LRT为选择滞后阶数提供形式化检验。
  1. 生存分析:Cox比例风险模型中比较含不同协变量组的模型,评估协变量对生存时间的联合影响。

局限性与现代拓展

LRT对模型假设较为敏感:误设的似然函数直接导致检验失真。对于非嵌套模型,LRT无法直接使用,此时可借助AIC、BIC等信息准则或Vuong检验进行比较。在高维数据(p > n)情形下,经典LRT因Fisher信息矩阵不可逆而失效,研究者提出了高维修正似然比检验(如Chen等人的方法)和正则化似然比检验。此外,基于bootstrap的LRT在小样本和非标准条件下提供了更可靠的推断工具,成为现代应用中的常用替代方案。