ARTICLE

最大似然估计量

最大似然估计量 (Maximum Likelihood Estimator, MLE) 最大似然估计量(Maximum Likelihood Estimator,MLE)是统计学和计量经济学中核心的参数估计方法,属于点估计的重要分支。其基本思想是在给定观测样本的前提下,寻找使这些样本出现可能性最大的参数值,作为总体参数的估计。该方法由统计学家罗纳德·费雪于2

浏览 5 更新 2025-11-08

最大似然估计量 (Maximum Likelihood Estimator, MLE)

最大似然估计量(Maximum Likelihood Estimator,MLE)是统计学计量经济学中核心的参数估计方法,属于点估计的重要分支。其基本思想是在给定观测样本的前提下,寻找使这些样本出现可能性最大的参数值,作为总体参数的估计。该方法由统计学家罗纳德·费雪于20世纪初系统提出,现已成为现代统计推断的基石之一。

核心概念与构造方法

似然函数是MLE的核心。似然函数在形式上与概率密度函数(PDF)或概率质量函数(PMF)完全相同,但解释视角截然不同。对于随机样本 X1,,XnX_1, \ldots, X_n 来自概率分布 f(x;θ)f(x; \theta),其中 θ\theta 为未知参数,给定样本观测值 x1,,xnx_1, \ldots, x_n,似然函数定义为 L(θ;x1,,xn)=i=1nf(xi;θ)L(\theta; x_1, \ldots, x_n) = \prod_{i=1}^n f(x_i; \theta)。在概率密度函数中,参数固定而视 xx 为变量,求的是参数已知时观测到某数据的概率;在似然函数中,观测值固定而视 θ\theta 为变量,求的是给定数据下各参数值的似然程度。

MLE定义为最大化对数似然函数 (θ)=lnL(θ)\ell(\theta) = \ln L(\theta) 的参数值,即 θ^MLE=argmaxθ(θ)\hat{\theta}_{\text{MLE}} = \operatorname{argmax}_\theta \ell(\theta)。对数变换将乘积转为累加,简化了求导运算,且不改变最大值的位置,因为对数函数是严格单调递增的。通常通过一阶条件 (θ)/θ=0\partial \ell(\theta)/\partial \theta = 0 求解,并需验证二阶条件以确保求得的是最大值而非最小值。在多参数情形下,需要使用梯度海塞矩阵进行优化,Fisher信息矩阵用于评估估计精度。

渐近性质与不变性

MLE具有出色的渐近性质。一致性保证随着样本量增大,MLE依概率收敛于真实参数值。渐近正态性表明 n(θ^MLEθ)dN(0,I(θ)1)\sqrt{n}(\hat{\theta}_{\text{MLE}} - \theta) \xrightarrow{d} N(0, I(\theta)^{-1}),其中 I(θ)I(\theta) 为Fisher信息量,MLE的渐近方差达到Cramer-Rao下界,即MLE是渐近有效的,在所有一致估计量中,MLE在渐近意义上具有最小方差,体现大样本最优性。

不变性是MLE的另一关键性质。若 θ^\hat{\theta}θ\theta 的MLE,则对任意函数 g()g(\cdot)g(θ^)g(\hat{\theta}) 即为 g(θ)g(\theta) 的MLE。该性质使MLE在非线性变换下可以直接使用而无需重新估计。例如,估计方差 σ2\sigma^2 的MLE之后,标准差 σ\sigma 的MLE即为 σ^2\sqrt{\hat{\sigma}^2},无需额外计算。

计量经济学中,MLE广泛应用于逻辑回归泊松回归有序响应模型样本选择模型(Heckman模型)和结构估计等非线性模型。当普通最小二乘法因非线性或非正态性而失效时,MLE提供了既一致又渐近有效的替代估计策略。MLE因其最优渐近性质、不变性和大样本下的通用适用性,是现代统计推断和计量经济学中不可替代的核心工具。