ARTICLE
频率学派统计 (frequentist statistics)
频率学派统计 (Frequentist Statistics) 频率学派统计 (Frequentist Statistics),也称经典统计,是统计推断的两大哲学框架之一(另一为贝叶斯统计)。频率学派的核心原则为,概率被解释为在无限次重复试验中事件发生的长期频率,而非主观信念的程度。在此框架下,未知参数 被视为固定但未知的常数——不具有概率分布——所有不确定
频率学派统计 (Frequentist Statistics)
频率学派统计 (Frequentist Statistics),也称经典统计,是统计推断的两大哲学框架之一(另一为贝叶斯统计)。频率学派的核心原则为,概率被解释为在无限次重复试验中事件发生的长期频率,而非主观信念的程度。在此框架下,未知参数 被视为固定但未知的常数——不具有概率分布——所有不确定性来源于样本的随机性。统计推断的目标是通过抽样分布的性质来评估估计量和检验程序在重复抽样下的长期表现,而非给出参数的概率陈述。
核心工具:假设检验与置信区间
频率学派的两大推断工具为假设检验(以Neyman-Pearson引理为基础)和置信区间(以Neyman 的置信区间理论为基础)。在假设检验中,显著性水平 被解释为"当零假设为真时,检验在无限次重复中错误拒绝零假设的比例"——这是频率学派对长期错误率的严格控制逻辑。p值衡量"在零假设为真时,观测到与当前数据同等或更极端结果的概率",同样依赖重复抽样的频率解释。
置信区间的频率解释常被误解:95\% 置信区间并非有 95\% 的概率包含真实参数值——因为频率学派中参数不是随机变量。正确的解释是:如果重复采集样本并每次构造 95\% 的置信区间,在无限次重复中约有 95\% 的区间将覆盖真实的固定参数值。这一定义强调了频率学派评价统计方法的元标准:无偏性、一致性和覆盖率——评估的是"方法"在重复使用下的性能,而非单次推断的可信度。
频率学派与贝叶斯学派的比较
两大学派的根本分歧在于对"概率"和"参数"的本体论定义。频率学派将概率限定于可重复事件的长期频率、参数为固定常数;贝叶斯学派将概率扩展为主观不确定性程度、参数具有先验分布并通过贝叶斯定理更新为后验分布。在操作层面,频率方法在大样本下由中心极限定理和大数定律提供分布自由的渐近保证,计算上通常比贝叶斯方法(MCMC或变分推断)更轻量。贝叶斯方法在小样本、层级模型和先验信息丰富时具有自然优势,且后验概率的直观解释避免了置信区间的诠释陷阱。
在计量经济学的实践中,大多数报告的估计结果——OLS系数、标准误、t统计量和p值——采用频率学派的框架。然而,Bayes因子和层次贝叶斯模型在面板数据、空间模型和结构化计量中的使用正在增长,反映了现代应用经济学中方法论多元化的趋势。频率学派和贝叶斯学派并非不可调和的替代者,而是提供了适用于不同数据结构和推断目标的互补视角。