MLE的不变性 (Invariance Property of MLE)
MLE的不变性(Invariance Property of Maximum Likelihood Estimator),也称函数不变性或变换不变性,是最大似然估计 (MLE)方法一个极其重要且方便的性质。该性质指出:如果θ ^ \hat{\theta} θ ^ 是参数θ \theta θ 的MLE,那么对于任意关于θ \theta θ 的函数g ( θ ) g(\theta) g ( θ ) ,其MLE就是g ( θ ^ ) g(\hat{\theta}) g ( θ ^ ) ——求参数函数的MLE无需重新构建和最大化新似然函数 ,直接代入即可。这极大地简化了对参数变换形式的估计过程。
形式化表述与理论证明
设随机样本的PDF为f ( x ; θ ) f(x;\theta) f ( x ; θ ) ,θ ^ M L E = arg max θ L ( θ ; x ) \hat{\theta}_{MLE} = \arg\max_\theta L(\theta; \mathbf{x}) θ ^ M L E = arg max θ L ( θ ; x ) 是参数的MLE。对参数τ = g ( θ ) \tau = g(\theta) τ = g ( θ ) ,MLE不变性表明τ ^ M L E = g ( θ ^ M L E ) \hat{\tau}_{MLE} = g(\hat{\theta}_{MLE}) τ ^ M L E = g ( θ ^ M L E ) 。对参数向量情形同样适用:τ ^ M L E = g ( θ ^ 1 , … , θ ^ k ) \hat{\tau}_{MLE} = g(\hat{\theta}_1, \ldots, \hat{\theta}_k) τ ^ M L E = g ( θ ^ 1 , … , θ ^ k ) 。
证明根据函数性质分两种情况。一对一映射情形 :存在反函数h = g − 1 h = g^{-1} h = g − 1 使θ = h ( τ ) \theta = h(\tau) θ = h ( τ ) 。重新参数化似然函数为L ∗ ( τ ; x ) = L ( h ( τ ) ; x ) L^*(\tau; \mathbf{x}) = L(h(\tau); \mathbf{x}) L ∗ ( τ ; x ) = L ( h ( τ ) ; x ) 。因L L L 在θ ^ M L E \hat{\theta}_{MLE} θ ^ M L E 处最大,L ∗ L^* L ∗ 在满足h ( τ ) = θ ^ M L E h(\tau) = \hat{\theta}_{MLE} h ( τ ) = θ ^ M L E 的τ \tau τ 处最大。令该点为τ ^ M L E \hat{\tau}_{MLE} τ ^ M L E ,则h ( τ ^ M L E ) = θ ^ M L E h(\hat{\tau}_{MLE}) = \hat{\theta}_{MLE} h ( τ ^ M L E ) = θ ^ M L E ,应用g g g 得τ ^ M L E = g ( θ ^ M L E ) \hat{\tau}_{MLE} = g(\hat{\theta}_{MLE}) τ ^ M L E = g ( θ ^ M L E ) 。证明完成。
非一对一函数情形 :通过诱导似然函数(induced likelihood function)定义来处理——定义L ∗ ( τ ; x ) = sup θ : g ( θ ) = τ L ( θ ; x ) L^*(\tau; \mathbf{x}) = \sup_{\theta: g(\theta)=\tau} L(\theta; \mathbf{x}) L ∗ ( τ ; x ) = sup θ : g ( θ ) = τ L ( θ ; x ) ,即在所有满足g ( θ ) = τ g(\theta)=\tau g ( θ ) = τ 的θ \theta θ 中取似然函数的极大值。可以证明τ ^ M L E = g ( θ ^ M L E ) \hat{\tau}_{MLE} = g(\hat{\theta}_{MLE}) τ ^ M L E = g ( θ ^ M L E ) 在该广义设定下仍然成立。不变性的直观理解在于:似然函数衡量数据对参数值的支持度,找到最受支持的参数值后,该支持度自然传递给其函数值。
应用示例与适用范围
MLE不变性的典型应用示例如下。正态分布N ( μ , σ 2 ) N(\mu, \sigma^2) N ( μ , σ 2 ) :σ 2 \sigma^2 σ 2 的MLE为σ ^ 2 = ( 1 / n ) ∑ ( X i − X ˉ ) 2 \hat{\sigma}^2 = (1/n)\sum(X_i - \bar{X})^2 σ ^ 2 = ( 1/ n ) ∑ ( X i − X ˉ ) 2 ,则σ = σ 2 \sigma = \sqrt{\sigma^2} σ = σ 2 的MLE为σ ^ 2 \sqrt{\hat{\sigma}^2} σ ^ 2 (无需重新优化)。伯努利分布:成功概率p p p 的MLE为p ^ = X ˉ \hat{p} = \bar{X} p ^ = X ˉ ,则几率比 (odds ratio)p / ( 1 − p ) p/(1-p) p / ( 1 − p ) 的MLE为p ^ / ( 1 − p ^ ) \hat{p}/(1-\hat{p}) p ^ / ( 1 − p ^ ) 。对数正态分布均值exp ( μ + σ 2 / 2 ) \exp(\mu+\sigma^2/2) exp ( μ + σ 2 /2 ) 的MLE为exp ( μ ^ + σ ^ 2 / 2 ) \exp(\hat{\mu}+\hat{\sigma}^2/2) exp ( μ ^ + σ ^ 2 /2 ) 。
需注意MLE不变性适用于点估计值本身,但MLE的无偏性 不具有变换不变性——例如σ ^ 2 \hat{\sigma}^2 σ ^ 2 可能有偏但其平方根σ ^ \hat{\sigma} σ ^ 通常不是无偏的。对于贝叶斯估计 ,MAP估计一般不具有MLE式的不变性——这是因为MAP优化中先验项变换后不保持。在估计量的渐近方差 方面,需用Delta方法 计算变换后MLE的渐近分布。MLE不变性以其概念的简洁性与实践的便利性,是MLE方法在应用中最受称道的性质之一。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。