ARTICLE
似然
似然 (Likelihood) 似然是统计学和计量经济学中的核心概念,与概率 (Probability) 既有本质区别又有紧密联系。它度量在给定统计模型及其参数的前提下,已观测到的样本数据出现的"可能性"大小。似然是进行参数估计、假设检验和模型选择的基石,尤其以最大似然估计 (MLE) 和似然比检验最为重要。 似然的定义:与概率的根本区别 假设随机变量 X
似然 (Likelihood)
似然是统计学和计量经济学中的核心概念,与概率 (Probability) 既有本质区别又有紧密联系。它度量在给定统计模型及其参数的前提下,已观测到的样本数据出现的"可能性"大小。似然是进行参数估计、假设检验和模型选择的基石,尤其以最大似然估计 (MLE) 和似然比检验最为重要。
似然的定义:与概率的根本区别
假设随机变量 服从概率分布 ,其中 为未知参数。抽取样本 ,则似然函数定义为:
理解似然的关键在于区分两种观察角度:概率将参数 视为固定,问"在已知参数下,哪些数据可能出现?";似然则将数据 视为固定(已观测到),问"哪些参数值能使我们观察到的数据显得最合理?"。换言之,似然函数是参数 的函数,而非数据的函数。
这一区别由R. A. Fisher于1920年代系统阐述,奠定了现代统计推断的哲学基础。公式上, 与联合概率密度 形式相同,但自变量不同,解释也不同。似然值本身不满足概率公理——似然函数在参数空间上的积分未必为1,也不具有概率的加法法则。
最大似然估计 (MLE)
最大似然估计是寻找使似然函数(或等价地,对数似然函数)最大化的参数值 :
为计算方便,通常对似然函数取自然对数,得对数似然函数:
对数变换将乘积化为求和,不仅简化求导,还改善数值稳定性。最大化一阶条件为得分函数 。
MLE的大样本性质
在正则条件(如参数空间为开集、真实参数在内部、对数似然三次可微等)下,MLE具备优良的大样本性质。一致性:,随样本量增大收敛至真实参数。渐近正态性:
其中 为费雪信息矩阵 (Fisher Information),度量样本包含的关于参数的信息量。渐近有效性:在一切一致渐近正态估计量中,MLE的渐近方差达到克拉美-罗下界 (Cramér-Rao Lower Bound),是最优的。
似然比检验 (Likelihood Ratio Test)
似然比检验是基于似然的经典假设检验方法,用于比较嵌套模型。检验统计量为:
其中 为在原假设 约束下(受限制模型)的MLE, 为无约束(不受限)MLE。在 下,LR统计量渐近服从卡方分布 ,自由度为约束个数 。LR检验与Wald检验和Lagrange乘数检验 (LM检验) 并称三大渐近检验,在广义线性模型、时间序列分析和面板数据模型中广泛应用。
似然原理与应用
似然原理 (Likelihood Principle) 指出:样本数据中所有关于参数 的信息完全包含在似然函数之中;若两个实验产生成比例的似然函数,则对 的推断应完全相同。这构成了似然学派(类频率)统计哲学的核心,与贝叶斯推断的先验分布观点形成对照——在贝叶斯框架中,后验分布正比于似然函数乘以先验分布:。
在经济学与计量经济学实践中,似然方法贯穿:Probit模型与Logit模型的二元选择估计、结构方程模型的参数识别、自回归条件异方差模型 (ARCH/GARCH) 的波动率建模,以及随机前沿分析的效率测定。似然不仅是数学工具,更是连接数据与模型、样本与总体的逻辑桥梁。