ARTICLE

频率学派解释

频率学派解释 (Frequentist Interpretation) 频率学派解释 (Frequentist Interpretation of Probability),又称概率的频率定义或客观概率论,是将概率定义为在大量重复随机试验中,某一事件发生的相对频率的极限值的理论体系。它是现代数理统计学的两大哲学基石之一,与贝叶斯学派解释形成方法论上的对称对立

浏览 0 更新 2025-11-08

频率学派解释 (Frequentist Interpretation)

频率学派解释 (Frequentist Interpretation of Probability),又称概率的频率定义或客观概率论,是将概率定义为在大量重复随机试验中,某一事件发生的相对频率的极限值的理论体系。它是现代数理统计学的两大哲学基石之一,与贝叶斯学派解释形成方法论上的对称对立。频率学派由 Richard von Mises 在 1919 年系统化,后经 Jerzy Neyman、Egon Pearson 和 Ronald Fisher 等人的发展,成为 20 世纪统计学的主流范式,至今仍是实验科学、医学统计和质量控制等领域的默认方法论框架。

核心定义:概率作为长期频率的极限

在频率学派的框架下,一个事件 AA 的概率 P(A)P(A) 被严格定义为:

P(A)=limnnAnP(A) = \lim_{n \to \infty} \frac{n_A}{n}

其中 nn 为独立重复试验的总次数,nAn_A 为事件 AA 发生的次数。这一定义要求试验必须是可无限重复的,且每次试验在相同条件下独立进行。概率的客观性来源于大数定律的数学保障:当试验次数趋于无穷时,相对频率以概率 1 收敛于真实概率。换言之,概率不是一个"信念度",而是物理系统的一个可测量属性——如同长度、质量一般客观存在。

Von Mises 进一步提出了两个核心条件来规范这一定义:其一是收敛条件,即相对频率的极限必须存在;其二是随机性条件(或称无规则性原则),即事件的发生序列不应存在任何可被利用的预测模式——这实质上是对独立同分布假设的哲学化表述。

方法论工具:从假设检验到置信区间

频率学派的核心哲学承诺——概率是世界的属性,而非认知者的属性——催生了一系列具有操作定义 (Operational Definition) 特征的统计工具:

  1. 假设检验 (Hypothesis Testing):Neyman-Pearson 框架将统计决策建模为在两类错误率(I 类错误 α\alpha 与 II 类错误 β\beta)之间权衡的优化问题。一个假设被"接受"或"拒绝",依据的是在重复抽样的长序列中,检验程序是否以受控的错误率做出正确决策。核心量 pp 值并非假设为真的概率,而是"若原假设为真,观察到当前或更极端数据的概率"——这一微妙但关键的区分,是频率学派与贝叶斯学派之间最频繁的误解来源。
  2. 置信区间 (Confidence Interval):一个 95\% 置信区间并非意味着真参数有 95\% 的概率落在该区间内(这是贝叶斯可信区间的解释),而是指:若无限次重复抽样并每次构建一个区间,则其中 95\% 的区间会覆盖真实参数。参数在频率学派中是固定的未知常数,不具备概率分布。
  3. 最大似然估计 (Maximum Likelihood Estimation):Fisher 提出的似然方法在操作上是频率学派的——它寻找使观察数据"最可能"出现的参数值,且在大样本下具有相合性与渐近正态性。尽管似然函数本身可被贝叶斯学派借用以构建后验分布,Fisher 始终坚持将概率解释局限于可重复事件的频率框架内。

与贝叶斯学派的核心分歧

频率学派与贝叶斯学派的根本分歧在于概率的本体论地位。频率学派拒绝将概率赋予单个事件或假设——"明天有 60\% 的概率下雨"在严格频率学派看来是不可接受的表述,因为"明天"是唯一的、不可重复的。类似地,"这个药物有效的概率是 0.8"也无法在频率框架中获得严格解释:药物要么有效,要么无效,它是一个确定的未知事实,而非随机变量。

贝叶斯学派通过将概率重新解释为信念度 (Degree of Belief),巧妙地消解了这一困难,但频率学派反驳称,这种主观概率引入了先验选择的任意性,破坏了科学结论的客观性。Fisher 尤为激烈地反对将先验分布引入统计推断,他认为科学证据应当"让数据自己说话"(Let the data speak for themselves),而不应被研究者的事前信念所污染。这一争论贯穿了整个 20 世纪的统计学史,至今未完全消弭。

批评、局限与调和

频率学派面临的主要批评包括:(1) 一次性事件问题——如选举预测、金融危机等不可重复事件,频率定义难以适用;(2) 参考类问题——一个事件可被归类到多种不同的"重复试验"集合中,频率取决于参考类的选择,这引入了隐蔽的主观性;(3) 停止规则依赖性——pp 值和置信区间依赖于实验设计中的停止规则(如是否提前终止试验),这一"不合直觉"的性质在频率框架内是逻辑一致的,却被批评为与科学实践脱节。

尽管如此,频率学派的方法论体系——尤其是随机化试验、显著性检验和置信区间——构成了当代实证科学的制度性基础设施。FDA 的药物审批标准、CERN 的粒子发现准则 ("5σ\sigma" 标准)、临床试验的预注册制度,均在操作上以频率学派的错误率控制为核心逻辑。在实践中,许多应用统计学家采取实用主义的折衷立场:用频率学派工具控制决策错误率,同时用贝叶斯方法进行灵活的建模与先验信息融合。这一方法论多元主义趋势反映了统计学从哲学教条之争走向问题导向的务实演进。