ARTICLE

似然

似然 (Likelihood) 似然是统计学和计量经济学中的核心概念,与概率 (Probability) 既有本质区别又有紧密联系。它度量在给定统计模型及其参数的前提下,已观测到的样本数据出现的"可能性"大小。似然是进行参数估计、假设检验和模型选择的基石,尤其以最大似然估计 (MLE) 和似然比检验最为重要。 似然的定义:与概率的根本区别 假设随机变量 X

浏览 4 更新 2025-10-26

似然 (Likelihood)

似然统计学计量经济学中的核心概念,与概率 (Probability) 既有本质区别又有紧密联系。它度量在给定统计模型及其参数的前提下,已观测到的样本数据出现的"可能性"大小。似然是进行参数估计假设检验模型选择的基石,尤其以最大似然估计 (MLE) 和似然比检验最为重要。

似然的定义:与概率的根本区别

假设随机变量 XX 服从概率分布 f(xθ)f(x \mid \theta),其中 θ\theta 为未知参数。抽取样本 x1,x2,,xnx_1, x_2, \dots, x_n,则似然函数定义为:

L(θx)=i=1nf(xiθ)L(\theta \mid x) = \prod_{i=1}^{n} f(x_i \mid \theta)

理解似然的关键在于区分两种观察角度:概率将参数 θ\theta 视为固定,问"在已知参数下,哪些数据可能出现?";似然则将数据 xx 视为固定(已观测到),问"哪些参数值能使我们观察到的数据显得最合理?"。换言之,似然函数是参数 θ\theta 的函数,而非数据的函数。

这一区别由R. A. Fisher于1920年代系统阐述,奠定了现代统计推断的哲学基础。公式上,L(θx)L(\theta \mid x) 与联合概率密度 f(xθ)f(x \mid \theta) 形式相同,但自变量不同,解释也不同。似然值本身不满足概率公理——似然函数在参数空间上的积分未必为1,也不具有概率的加法法则。

最大似然估计 (MLE)

最大似然估计是寻找使似然函数(或等价地,对数似然函数)最大化的参数值 θ^MLE\hat{\theta}_{\text{MLE}}

θ^MLE=argmaxθΘL(θx)\hat{\theta}_{\text{MLE}} = \arg\max_{\theta \in \Theta} L(\theta \mid x)

为计算方便,通常对似然函数取自然对数,得对数似然函数

(θ)=lnL(θx)=i=1nlnf(xiθ)\ell(\theta) = \ln L(\theta \mid x) = \sum_{i=1}^{n} \ln f(x_i \mid \theta)

对数变换将乘积化为求和,不仅简化求导,还改善数值稳定性。最大化一阶条件为得分函数 S(θ)=θ=0S(\theta) = \frac{\partial \ell}{\partial \theta} = 0

MLE的大样本性质

正则条件(如参数空间为开集、真实参数在内部、对数似然三次可微等)下,MLE具备优良的大样本性质。一致性θ^MLEpθ0\hat{\theta}_{\text{MLE}} \xrightarrow{p} \theta_0,随样本量增大收敛至真实参数。渐近正态性

n(θ^MLEθ0)dN(0,I(θ0)1)\sqrt{n}(\hat{\theta}_{\text{MLE}} - \theta_0) \xrightarrow{d} N(0, I(\theta_0)^{-1})

其中 I(θ0)I(\theta_0)费雪信息矩阵 (Fisher Information),度量样本包含的关于参数的信息量。渐近有效性:在一切一致渐近正态估计量中,MLE的渐近方差达到克拉美-罗下界 (Cramér-Rao Lower Bound),是最优的。

似然比检验 (Likelihood Ratio Test)

似然比检验是基于似然的经典假设检验方法,用于比较嵌套模型。检验统计量为:

LR=2ln(L(θ^0)L(θ^))=2[(θ^)(θ^0)]\text{LR} = -2 \ln \left( \frac{L(\hat{\theta}_0)}{L(\hat{\theta})} \right) = 2[\ell(\hat{\theta}) - \ell(\hat{\theta}_0)]

其中 θ^0\hat{\theta}_0 为在原假设 H0H_0 约束下(受限制模型)的MLE,θ^\hat{\theta} 为无约束(不受限)MLE。在 H0H_0 下,LR统计量渐近服从卡方分布 χ2(r)\chi^2(r),自由度为约束个数 rr。LR检验与Wald检验Lagrange乘数检验 (LM检验) 并称三大渐近检验,在广义线性模型时间序列分析面板数据模型中广泛应用。

似然原理与应用

似然原理 (Likelihood Principle) 指出:样本数据中所有关于参数 θ\theta 的信息完全包含在似然函数之中;若两个实验产生成比例的似然函数,则对 θ\theta 的推断应完全相同。这构成了似然学派(类频率)统计哲学的核心,与贝叶斯推断先验分布观点形成对照——在贝叶斯框架中,后验分布正比于似然函数乘以先验分布:π(θx)L(θx)π(θ)\pi(\theta \mid x) \propto L(\theta \mid x) \cdot \pi(\theta)

在经济学与计量经济学实践中,似然方法贯穿:Probit模型Logit模型的二元选择估计、结构方程模型的参数识别、自回归条件异方差模型 (ARCH/GARCH) 的波动率建模,以及随机前沿分析的效率测定。似然不仅是数学工具,更是连接数据与模型、样本与总体的逻辑桥梁。