ARTICLE

Cohen's f

Cohen's f Cohen's f 是效应量(effect size)的一种标准化度量,由 Jacob Cohen 在其经典的统计功效分析框架中提出。它主要用于方差分析(ANOVA)和多元回归的背景下,量化群体均值之间差异的整体幅度,或一组预测变量对结果变量的综合解释力。与Cohen's d(衡量两组均值之差)不同,Cohen's f 适用于涉及三组及以

浏览 0 更新 2026-07-18

Cohen's f

Cohen's f效应量(effect size)的一种标准化度量,由 Jacob Cohen 在其经典的统计功效分析框架中提出。它主要用于方差分析(ANOVA)和多元回归的背景下,量化群体均值之间差异的整体幅度,或一组预测变量对结果变量的综合解释力。与Cohen's d(衡量两组均值之差)不同,Cohen's f 适用于涉及三组及以上或连续预测变量的复杂设计。它是功效分析(power analysis)、样本量规划以及元分析中不可或缺的工具。

定义与公式

在 ANOVA 的单因素设计中,Cohen's f 基于eta 平方η2\eta^2)——即组间平方和与总平方和的比值——来定义:

f=η21η2f = \sqrt{\frac{\eta^2}{1 - \eta^2}}

其中 η2=SSbetweenSStotal\eta^2 = \frac{SS_{\text{between}}}{SS_{\text{total}}},衡量的是分组因素所解释的方差比例。当 η2=0\eta^2 = 0 时各组均值完全相等,此时 f=0f = 0;随着组间差异增大,ff 也随之增大。

在更一般的情境中——如多元回归中检验一组预测变量的增量解释力——Cohen's f 可表述为:

f=Rfull2Rreduced21Rfull2f = \sqrt{\frac{R^2_{\text{full}} - R^2_{\text{reduced}}}{1 - R^2_{\text{full}}}}

其中 Rfull2R^2_{\text{full}} 是全模型(包含待检验预测变量)的决定系数,Rreduced2R^2_{\text{reduced}} 是简化模型(不包含待检验预测变量)的决定系数。这个形式直接衡量了目标变量集所贡献的"局部效应量"(partial effect size)。当全模型只有一个分组因素且简化模型仅有截距时,该公式退化为前述 ANOVA 形式。

此外,Cohen's f 与Cohen's f²(用于回归中单个预测变量的效应量)存在直接关联:f2=ff^2 = f²。Cohen's f² 的另一等价定义是 f2=R21R2f^2 = \frac{R^2}{1 - R^2},其中 R2R^2 为全模型的解释方差比。

效应量基准与解释

Cohen (1988) 为 ANOVA 情景下的 f 提出了三档经验基准,至今被广泛应用于社会科学与行为科学的样本量规划:

  • 小效应(small):f=0.10f = 0.10。对应于 η20.01\eta^2 \approx 0.01,即分组能解释约 1\% 的方差。这种效应通常需要大样本才能检测。
  • 中等效应(medium):f=0.25f = 0.25。对应于 η20.059\eta^2 \approx 0.059,即约 6\% 的方差被解释。
  • 大效应(large):f=0.40f = 0.40。对应于 η20.138\eta^2 \approx 0.138,即近 14\% 的方差被解释。

需要强调的是,这些阈值只是 Cohen 基于行为科学文献提出的经验参考,并非绝对的"好/差"标准。在某些领域中,f=0.05f = 0.05 可能已具有实质意义(如教育干预中),而在严格控制条件的实验室研究中,f=0.40f = 0.40 也可能被视为平庸。研究者应结合学科惯例、研究设计以及效应的实际含义来判断。

与 Cohen's d 的关系

Cohen's d 是两组均值差异的标准差标准化度量:d=μ1μ2σd = \frac{\mu_1 - \mu_2}{\sigma}。当只有两个组时,Cohen's f 与 Cohen's d 之间存在精确的数学关系。

对于平衡两组设计(每组样本量相等):

f=d2f = \frac{d}{2}

或等价地 d=2fd = 2f

这一关系可从方差分解推导得出:在两组建模中,η2=d2d2+4\eta^2 = \frac{d^2}{d^2 + 4},代入 f=η21η2f = \sqrt{\frac{\eta^2}{1 - \eta^2}} 即得 f=d/2f = d/2

据此,Cohen's d 的基准(小 = 0.20,中 = 0.50,大 = 0.80)与 Cohen's f 的基准(小 = 0.10,中 = 0.25,大 = 0.40)恰好对应,保持了一致性。

对于不等组或多组(k > 2),Cohen's f 可通过各组均值与总均值的标准化离差来直接计算:

f=j=1kpj(μjμ)2σ2f = \sqrt{\frac{\sum_{j=1}^{k} p_j (\mu_j - \mu)^2}{\sigma^2}}

其中 pjp_j 为第 j 组在总体中的比例,μj\mu_j 为第 j 组的均值,μ\mu 为总均值,σ2\sigma^2 为各组共同的组内方差(假设方差齐性)。

在功效分析中的应用

Cohen's f 最核心的实际用途在于统计功效(Statistical Power)分析——在给定效应量、显著性水平 α\alpha 和样本量的条件下,计算正确拒绝虚无假设的概率。对于 F 检验,功效分析通常涉及以下参数:

  • 效应量 f:来自理论预期、先前研究或 Cohen 基准。
  • 显著性水平 α\alpha:通常取 0.05。
  • 样本量 n:每组观测数。
  • 分子自由度df1=k1df_1 = k - 1(ANOVA)或待检验预测变量个数(回归)。
  • 功效1β1 - \beta,通常要求在 0.80 以上。

在 G*Power、R 的 \texttt{pwr} 包等功效分析软件中,Cohen's f 是执行 F 检验族功效计算的标准化输入参数。研究者通过设定期望的功效水平(如 0.80),反推所需的最小样本量。如果可获得的样本量固定,则可通过给定 f 和 n 计算研究能检测到该效应的概率,从而评估研究的可行性。

以下是一个 R 中利用 \texttt{pwr} 包进行 ANOVA 功效分析的示例:

library(pwr)
pwr.anova.test(k = 4, f = 0.25, power = 0.80, sig.level = 0.05)

上例为单因素 ANOVA、4 组、中等效应 f=0.25f=0.25、功效 0.80 时的样本量规划;每组约需 45 个观测。

ω2\omega^2ϵ2\epsilon^2 的关系

虽然 Cohen's f 基于 η2\eta^2 来定义,但 η2\eta^2 作为样本统计量是有偏的——它倾向于高估总体的真实效应量,尤其是在小样本中。因此,在效应量的实际报告与元分析中,更推荐使用omega 平方ω2\omega^2)或epsilon 平方ϵ2\epsilon^2)等修正估计量。

ω2\omega^2 在单因素 ANOVA 中的定义为:

ω2=SSbetween(k1)MSwithinSStotal+MSwithin\omega^2 = \frac{SS_{\text{between}} - (k-1)MS_{\text{within}}}{SS_{\text{total}} + MS_{\text{within}}}

基于 ω2\omega^2 可定义修正版本的 Cohen's f:

fω=ω21ω2f_{\omega} = \sqrt{\frac{\omega^2}{1 - \omega^2}}

在大样本中 ω2\omega^2 趋近于 η2\eta^2,两者计算的 f 差异可忽略;但在小样本研究中,基于 ω2\omega^2 的 f 值更为保守,能更好地反映总体效应量,避免对功效的过度乐观估计。

局限性与注意事项

  1. 依赖方差齐性假设:Cohen's f 在 ANOVA 中假设各组方差相等。当方差齐性假设被违反时,基于 f 的功效分析可能失准,需使用 Welch 修正或稳健方法。
  2. 对非平衡设计敏感:在不等组设计中,各组样本量的差异会影响 η2\eta^2 的计算(Type I、II、III 平方和的选择),进而影响 f 的估计值。研究者需明确报告所使用的平方和类型。
  3. 基准的语境依赖性:如前所述,Cohen 的阈值是经验法则而非金科玉律。在元分析中,更推荐以该领域实际的效应量分布(如中位数 f 值)作为参考。
  4. 与 f² 的混淆:Cohen's f 和 Cohen's f² 是不同的指标——前者用于 ANOVA 和局部效应量,后者用于回归中单个预测变量的效应量(f2=R21R2f^2 = \frac{R^2}{1-R^2})。两者数值上不直接可比。
  5. 功效分析的事后局限性:不应在数据收集后进行所谓的"事后功效分析"(post-hoc power analysis)并用观察到的 f 值来解释非显著结果——这种操作具有误导性。功效分析应在前瞻性研究设计中完成。

总结

Cohen's f 是方差分析及多元回归框架下度量效应量的标准工具。它通过将组间差异或模型解释力转化为标准化指标,使不同设计和研究之间的效果可比,并提供严格的功效分析与样本量规划依据。理解其定义、与 Cohen's d 及 η2\eta^2 的关系、以及恰当的使用与解读方式,对于开展严谨的定量研究至关重要。