ARTICLE
似然原理
似然原理 (Likelihood Principle) 似然原理(Likelihood Principle)是统计推断中的一个基本原理,指出在给定观测数据后所有关于统计模型参数的信息都应当包含在似然函数之中。该原理强调对于同一统计模型的不同抽样方案,只要产生的似然函数成比例(仅相差与参数无关的常数因子),就应得出相同的推断结论。这一原理在贝叶斯统计和某些似然
似然原理 (Likelihood Principle)
似然原理(Likelihood Principle)是统计推断中的一个基本原理,指出在给定观测数据后所有关于统计模型参数的信息都应当包含在似然函数之中。该原理强调对于同一统计模型的不同抽样方案,只要产生的似然函数成比例(仅相差与参数无关的常数因子),就应得出相同的推断结论。这一原理在贝叶斯统计和某些似然推断方法中得到严格遵循,但与频率学派的一些传统实践存在根本性分歧。
核心思想与形式化表述
似然原理的核心观点:一旦数据被观测到,统计推断的结论应当仅依赖于实际观测到的数据,而不应依赖于那些"可能发生但未发生"的数据。这与频率学派考虑重复抽样下长期行为的做法形成鲜明对比——显著性水平和置信水平的计算都依赖于未观测数据的分布性质即样本空间的结构。似然原理体现了条件性原则——推断应基于实际观测到的事实条件而非基于实验设计阶段可能产生的所有结果。
数学上,对给定的观测数据,似然函数为。需注意:概率密度函数固定考虑关于的函数,似然函数固定数据考虑关于的函数——似然函数值本身没有概率解释,仅表示不同参数值对观测数据的相对支持程度。
形式化表述:设和是两个不同统计实验(可能采用不同抽样方案),似然函数分别为和。若存在不依赖的常数使对所有成立,则基于两个实验的推断结论应完全相同。强似然原理要求无论实验设计如何不同都产生相同推断,弱似然原理仅在同一实验不同样本间要求此性质。
停止规则问题与学派分歧
似然原理的经典验证是停止规则问题(Stopping Rule Problem)。以二项分布与负二项分布为例:方案一预决定进行次独立伯努利试验观测到次成功——似然函数;方案二决定持续试验直到获得次成功——恰好需次试验达到——似然函数。两方案似然函数成比例,强似然原理要求相同推断。但频率学派计算p值时方案一基于二项分布、方案二基于负二项分布——即使数据相同p值可能不同,置信区间和假设检验结果因此出现根本差异。
这一分歧揭示了频率学派与贝叶斯统计的深层对立。贝叶斯统计天然遵循似然原理——推断仅通过贝叶斯定理依赖于似然函数和先验分布,与停止规则及实验设计无关。而频率学派因方法性质(p值、置信区间、检验水平等均依赖样本空间结构)违背了似然原理。似然原理在统计哲学和统计方法论中持续引发讨论,对统计实践方法论的选择和实验设计的伦理考量均具有深远影响。