ARTICLE

似然原则

似然原则 (Likelihood Principle) 似然原则(Likelihood Principle)是统计推断中一条深具哲学意涵的根本性原理,它断言:在给定观测数据后,关于未知参数 的全部证据信息都已完整地蕴含在似然函数之中,而与实验设计、抽样规则或未发生的观测结果无关。换句话说,若两个统计实验对同一参数 分别产生观测 x 和 y,且相应的似然函数成

浏览 0 更新 2025-11-08

似然原则 (Likelihood Principle)

似然原则(Likelihood Principle)是统计推断中一条深具哲学意涵的根本性原理,它断言:在给定观测数据后,关于未知参数 θ\theta 的全部证据信息都已完整地蕴含在似然函数之中,而与实验设计、抽样规则或未发生的观测结果无关。换句话说,若两个统计实验对同一参数 θ\theta 分别产生观测 xxyy,且相应的似然函数成比例——即存在常数 c>0c > 0 使 L(θx)=cL(θy)L(\theta \mid x) = c \cdot L(\theta \mid y) 对所有 θ\theta 成立——则这两个观测所提供的关于 θ\theta 的证据强度应当完全相同。

这一原则由统计学家Allan Birnbaum于1962年正式提出,并由James BergerRobert Wolpert在1988年的专著中系统阐述。Birnbaum的深刻贡献在于证明了似然原则可以从两个更基本的统计原则——充分性原则(Sufficiency Principle)和条件性原则(Conditionality Principle)——推导得出。充分性原则表明,充分统计量保留了样本中关于参数的全部信息;条件性原则要求推断应当以实际发生的实验条件为条件,而非在所有可能的实验上平均。Birnbaum定理的结论是:接受充分性原则和条件性原则的逻辑后果就是接受似然原则。

强似然原则与弱似然原则

似然原则有强弱之分。强似然原则(Strong Likelihood Principle)是Birnbaum意义上的完整表述:当两个不同实验或两种不同观测所得的似然函数成比例时,关于参数的证据和推断应当一致。这一表述与实验设计本身完全脱钩——即便一个实验是固定样本量的二项抽样,另一个是按负二项规则持续到固定成功数的序贯抽样,只要最终的似然函数形状相同,结论就应一致。

弱似然原则(Weak Likelihood Principle)则是充分性原则的直接推论:在同一个实验内部,所有信息由似然函数经由充分统计量传递,两个产生相同似然函数的样本点提供相同的证据。弱似然原则在频率学派和贝叶斯学派之间争议较小,而强似然原则才是分歧的核心。

与频率学派方法的冲突

似然原则与频率学派(Frequentist)的许多标准推断程序存在根本性冲突。频率学派的方法——如假设检验中的p值计算、置信区间的构造——依赖于观测数据之外的概率计算,即对"可能发生但实际未发生"的样本结果求期望或概率。典型例子包括:

  • 序贯试验的停止规则:若实验者以"首次达到显著性时停止"的规则进行序贯抽样,频率学派需根据全部可能的停止时间调整p值和置信区间,否则推断将出现系统性偏误。但在似然原则下,停止规则不影响似然函数的形状,因此完全无关——只有实际观测到的数据才构成证据。
  • 二项抽样与负二项抽样的等价性:假设要推断硬币正面概率 pp,方案A为固定抛掷 n=20n=20 次,观测到12次正面;方案B为持续抛掷直到出现第8次反面,恰好在第20次停止。两者所得数据在数值上完全相同:(12次正面, 8次反面)。两者的似然函数均比于 p12(1p)8p^{12}(1-p)^8,在似然原则下证据相同。但频率学派对p值的计算因实验方案而异:方案A中p值基于"20次中正面数≥12"的尾部概率,方案B中基于"停止时间≥20"的分布——相同的观测数据可能得出截然不同的显著性结论。

频率学派对似然原则的拒斥部分源于对重复抽样性质的坚守:一个推断程序的优劣取决于其在长期重复使用下的频率表现(如覆盖率、第一类错误率),而非单次实验中已实现观测的证据强度。似然原则的拥护者则回应称,科学推断应当基于实际所见的数据,而非虚构的"可能发生但未发生"的情形。

与贝叶斯统计的天然契合

似然原则与贝叶斯统计之间存在近乎完美的契合。贝叶斯定理的核心——后验分布正比于似然函数与先验分布的乘积——本身就贯彻了似然原则:所有来自数据的证据仅通过似然函数进入后验。若两个实验产生成比例的似然函数,在相同先验下所得后验分布必然一致,进而所有基于后验的推断(点估计、区间估计、假设检验)也完全等同。正因如此,贝叶斯学派将似然原则视为统计推断的"自明之理"——它并非贝叶斯方法的外加约束,而是从贝叶斯框架内部自然涌现的逻辑必然。

然而,贝叶斯方法的这一优势也伴随代价:对先验分布的依赖意味着即便似然函数相同,不同先验仍可导出不同的后验结论。似然原则本身并不涉及先验的选择问题,它只保证"数据证据"的等价性,而非"最终结论"的一致性。

经济计量学中的意义

计量经济学中,似然原则为模型选择、估计方法和推断程序提供了重要的方法论基准。极大似然估计(MLE)天然遵循似然原则,因为它仅依赖似然函数的最大值位置。相比之下,广义矩估计(GMM)和许多基于渐近分布的方法则不满足似然原则,其推断结果可能因样本收集方式(如截断、分层或适应性抽样)的改变而改变,即便这些改变不改变似然函数的形状。在结构估计贝叶斯计量经济学中,似然原则为基于似然的推断方法——如贝叶斯因子后验 odds——的正当性提供了理论支撑,同时也揭示了频率学派模型诊断(如基于模拟p值的拟合优度检验)在原则层面的脆弱性。