ARTICLE

频率学派

频率学派 (Frequentist Statistics) 频率学派,也称经典统计学或频率学派统计,是与贝叶斯统计并列的现代统计学两大主要范式之一。其核心哲学立场在于:概率被定义为无限次独立重复试验中某一事件发生的相对频率的极限。换言之,概率是客观存在于外部世界的物理属性,而非个体的主观置信程度。这一学派的思想可追溯至伯努利的大数定律和卡尔·皮尔逊的早期统计

浏览 5 更新 2025-10-26

频率学派 (Frequentist Statistics)

频率学派,也称经典统计学频率学派统计,是与贝叶斯统计并列的现代统计学两大主要范式之一。其核心哲学立场在于:概率被定义为无限次独立重复试验中某一事件发生的相对频率的极限。换言之,概率是客观存在于外部世界的物理属性,而非个体的主观置信程度。这一学派的思想可追溯至伯努利的大数定律和卡尔·皮尔逊的早期统计工作,而由罗纳德·费希尔耶日·奈曼埃贡·皮尔逊在20世纪上半叶系统化为完整的推断体系。

核心哲学与参数观

频率学派最重要的形而上学承诺是将参数视为固定但未知的常数。在频率学派框架下,总体参数(如均值 μ\mu方差 σ2\sigma^2)具有一个真实、确定但观察者无从知晓的值。这与贝叶斯学派将参数建模为随机变量并赋予先验分布的立场截然对立。正因为参数不是随机变量,频率学派禁止对参数本身做出概率陈述——不能说"μ\mu 落在区间 [a,b][a,b] 的概率为95\%",而只能说该置信区间的构造方法在重复抽样下有95\%的频率覆盖真实参数。这一重复抽样解释构成了频率学派推断结果的哲学基础,也是最常被应用研究者误读之处。

主要推断工具

频率学派的推断体系建立在三大支柱之上:点估计假设检验区间估计

在点估计领域,最大似然估计(MLE)是频率学派的旗舰方法。MLE选择使观察到的数据出现概率最大化的参数值,由费希尔在20世纪20年代系统发展。MLE具有渐近无偏性、一致性和渐近有效性等优良大样本性质,且在正则条件下达到Cramér-Rao下界矩估计法则通过令样本矩等于总体矩来获得参数估计,计算更为简便但通常效率低于MLE。评判估计量的标准包括无偏性(期望等于真值)、一致性(随着样本量增大依概率收敛于真值)和有效性(在所有无偏估计量中方差最小)。Gauss-Markov定理保证了在古典线性回归假设下,OLS估计量是最优线性无偏估计量(BLUE),这是计量经济学中最重要的有限样本结论之一。

假设检验方面,形成了费希尔的显著性检验传统与奈曼-皮尔逊的假设检验框架的融合体系。费希尔提出p值作为衡量数据与原假设不一致程度的连续性指标——p值越小,数据与原假设的冲突越强。奈曼和皮尔逊则引入备择假设第I类错误(弃真)与第II类错误(取伪)的概念,并证明似然比检验在简单假设下具有最优功效(由Neyman-Pearson引理保证)。当代计量经济学实践中,t检验F检验Wald检验似然比检验拉格朗日乘数检验(LM检验)构成五大标准检验工具,广泛应用于回归系数的显著性判断和模型约束的验证。

区间估计的核心概念是置信区间。一个95\%置信区间的正确解释是:若从同一总体中独立重复抽取大量样本,并对每个样本构造一个置信区间,则其中约95\%的区间会包含真实参数。置信区间的构造依赖于枢轴量或渐近正态性:例如,在正态总体下,Xˉ±tα/2,n1s/n\bar{X} \pm t_{\alpha/2,n-1} \cdot s/\sqrt{n} 给出了均值的精确置信区间。对于复杂模型,Delta方法Bootstrap(Efron, 1979)提供了不依赖强分布假设的渐近或重抽样构造手段。

优势、局限与经济学应用

频率学派在统计实践中的持久主导地位源于其显著优势。其推断过程具有客观性:给定数据和模型设定,不同研究者会得到完全相同的点估计、p值和置信区间。这一可复现性特征契合了科学报告的公共审查需求。其理论完备性为大样本推断提供了坚实的基础:大数定律中心极限定理保证了MLE和众多检验统计量的渐近性质,使得无需对数据生成过程做出完全正确的参数假设即可进行近似推断。

然而,频率学派也面临持续的批评。p值的二分法使用(以0.05为阈值的"显著/不显著"判断)导致了发表偏倚p值操纵(p-hacking)等严重问题,推动了近年来"统计显著性改革"的呼声。置信区间的重复抽样解释在实际交流中常被错误地赋予贝叶斯式概率含义。此外,频率学派无法以正规途径纳入先验信息或专家知识,在先验信息丰富但样本稀缺的情境下面临局限。

计量经济学中,频率学派方法构成教学与应用的主流。从OLS、工具变量(IV)、广义矩估计(GMM)到面板数据的固定效应与随机效应模型,其推断框架均根植于频率学派传统。White异方差稳健标准误聚类稳健标准误等现代推断工具的底层逻辑同样是频率学派的重复抽样论证。尽管贝叶斯方法在计算层面取得突破并日益流行,低维回归、实验经济学和政策评估等多数应用经济学领域仍以频率学派为主导范式,两大学派之间的对话与互补构成了当代统计方法论演进的核心动力。