ARTICLE

似然原理

似然原理 (Likelihood Principle) 似然原理(Likelihood Principle)是统计推断中的一个基本原理,指出在给定观测数据后所有关于统计模型参数的信息都应当包含在似然函数之中。该原理强调对于同一统计模型的不同抽样方案,只要产生的似然函数成比例(仅相差与参数无关的常数因子),就应得出相同的推断结论。这一原理在贝叶斯统计和某些似然

浏览 0 更新 2025-11-12

似然原理 (Likelihood Principle)

似然原理(Likelihood Principle)是统计推断中的一个基本原理,指出在给定观测数据后所有关于统计模型参数的信息都应当包含在似然函数之中。该原理强调对于同一统计模型的不同抽样方案,只要产生的似然函数成比例(仅相差与参数无关的常数因子),就应得出相同的推断结论。这一原理在贝叶斯统计和某些似然推断方法中得到严格遵循,但与频率学派的一些传统实践存在根本性分歧。

核心思想与形式化表述

似然原理的核心观点:一旦数据xx被观测到,统计推断的结论应当仅依赖于实际观测到的数据,而不应依赖于那些"可能发生但未发生"的数据。这与频率学派考虑重复抽样下长期行为的做法形成鲜明对比——显著性水平置信水平的计算都依赖于未观测数据的分布性质即样本空间的结构。似然原理体现了条件性原则——推断应基于实际观测到的事实条件而非基于实验设计阶段可能产生的所有结果。

数学上,对给定的观测数据xobsx_{obs},似然函数为L(θ;xobs)=f(xobs;θ)L(\theta; x_{obs}) = f(x_{obs}; \theta)。需注意:概率密度函数f(x;θ)f(x; \theta)固定θ\theta考虑关于xx的函数,似然函数L(θ;xobs)L(\theta; x_{obs})固定数据考虑关于θ\theta的函数——似然函数值本身没有概率解释,仅表示不同参数值对观测数据的相对支持程度。

形式化表述:设E1E_1E2E_2是两个不同统计实验(可能采用不同抽样方案),似然函数分别为L1L_1L2L_2。若存在不依赖θ\theta的常数c>0c > 0使L1(θ;x1)=cL2(θ;x2)L_1(\theta; x_1) = c \cdot L_2(\theta; x_2)对所有θ\theta成立,则基于两个实验的推断结论应完全相同。强似然原理要求无论实验设计如何不同都产生相同推断,弱似然原理仅在同一实验不同样本间要求此性质。

停止规则问题与学派分歧

似然原理的经典验证是停止规则问题(Stopping Rule Problem)。以二项分布与负二项分布为例:方案一预决定进行n=12n=12次独立伯努利试验观测到x=3x=3次成功——似然函数L1θ3(1θ)9L_1 \propto \theta^3(1-\theta)^9;方案二决定持续试验直到获得33次成功——恰好需1212次试验达到——似然函数L2θ3(1θ)9L_2 \propto \theta^3(1-\theta)^9。两方案似然函数成比例,强似然原理要求相同推断。但频率学派计算p值时方案一基于二项分布、方案二基于负二项分布——即使数据相同p值可能不同,置信区间和假设检验结果因此出现根本差异。

这一分歧揭示了频率学派与贝叶斯统计的深层对立。贝叶斯统计天然遵循似然原理——推断仅通过贝叶斯定理依赖于似然函数和先验分布,与停止规则及实验设计无关。而频率学派因方法性质(p值、置信区间、检验水平等均依赖样本空间结构)违背了似然原理。似然原理在统计哲学统计方法论中持续引发讨论,对统计实践方法论的选择和实验设计的伦理考量均具有深远影响。