ARTICLE
Cohen's f
Cohen's f Cohen's f 是效应量(effect size)的一种标准化度量,由 Jacob Cohen 在其经典的统计功效分析框架中提出。它主要用于方差分析(ANOVA)和多元回归的背景下,量化群体均值之间差异的整体幅度,或一组预测变量对结果变量的综合解释力。与Cohen's d(衡量两组均值之差)不同,Cohen's f 适用于涉及三组及以
Cohen's f
Cohen's f 是效应量(effect size)的一种标准化度量,由 Jacob Cohen 在其经典的统计功效分析框架中提出。它主要用于方差分析(ANOVA)和多元回归的背景下,量化群体均值之间差异的整体幅度,或一组预测变量对结果变量的综合解释力。与Cohen's d(衡量两组均值之差)不同,Cohen's f 适用于涉及三组及以上或连续预测变量的复杂设计。它是功效分析(power analysis)、样本量规划以及元分析中不可或缺的工具。
定义与公式
在 ANOVA 的单因素设计中,Cohen's f 基于eta 平方()——即组间平方和与总平方和的比值——来定义:
其中 ,衡量的是分组因素所解释的方差比例。当 时各组均值完全相等,此时 ;随着组间差异增大, 也随之增大。
在更一般的情境中——如多元回归中检验一组预测变量的增量解释力——Cohen's f 可表述为:
其中 是全模型(包含待检验预测变量)的决定系数, 是简化模型(不包含待检验预测变量)的决定系数。这个形式直接衡量了目标变量集所贡献的"局部效应量"(partial effect size)。当全模型只有一个分组因素且简化模型仅有截距时,该公式退化为前述 ANOVA 形式。
此外,Cohen's f 与Cohen's f²(用于回归中单个预测变量的效应量)存在直接关联:²。Cohen's f² 的另一等价定义是 ,其中 为全模型的解释方差比。
效应量基准与解释
Cohen (1988) 为 ANOVA 情景下的 f 提出了三档经验基准,至今被广泛应用于社会科学与行为科学的样本量规划:
- 小效应(small):。对应于 ,即分组能解释约 1\% 的方差。这种效应通常需要大样本才能检测。
- 中等效应(medium):。对应于 ,即约 6\% 的方差被解释。
- 大效应(large):。对应于 ,即近 14\% 的方差被解释。
需要强调的是,这些阈值只是 Cohen 基于行为科学文献提出的经验参考,并非绝对的"好/差"标准。在某些领域中, 可能已具有实质意义(如教育干预中),而在严格控制条件的实验室研究中, 也可能被视为平庸。研究者应结合学科惯例、研究设计以及效应的实际含义来判断。
与 Cohen's d 的关系
Cohen's d 是两组均值差异的标准差标准化度量:。当只有两个组时,Cohen's f 与 Cohen's d 之间存在精确的数学关系。
对于平衡两组设计(每组样本量相等):
或等价地 。
这一关系可从方差分解推导得出:在两组建模中,,代入 即得 。
据此,Cohen's d 的基准(小 = 0.20,中 = 0.50,大 = 0.80)与 Cohen's f 的基准(小 = 0.10,中 = 0.25,大 = 0.40)恰好对应,保持了一致性。
对于不等组或多组(k > 2),Cohen's f 可通过各组均值与总均值的标准化离差来直接计算:
其中 为第 j 组在总体中的比例, 为第 j 组的均值, 为总均值, 为各组共同的组内方差(假设方差齐性)。
在功效分析中的应用
Cohen's f 最核心的实际用途在于统计功效(Statistical Power)分析——在给定效应量、显著性水平 和样本量的条件下,计算正确拒绝虚无假设的概率。对于 F 检验,功效分析通常涉及以下参数:
- 效应量 f:来自理论预期、先前研究或 Cohen 基准。
- 显著性水平 :通常取 0.05。
- 样本量 n:每组观测数。
- 分子自由度:(ANOVA)或待检验预测变量个数(回归)。
- 功效:,通常要求在 0.80 以上。
在 G*Power、R 的 \texttt{pwr} 包等功效分析软件中,Cohen's f 是执行 F 检验族功效计算的标准化输入参数。研究者通过设定期望的功效水平(如 0.80),反推所需的最小样本量。如果可获得的样本量固定,则可通过给定 f 和 n 计算研究能检测到该效应的概率,从而评估研究的可行性。
以下是一个 R 中利用 \texttt{pwr} 包进行 ANOVA 功效分析的示例:
library(pwr) pwr.anova.test(k = 4, f = 0.25, power = 0.80, sig.level = 0.05)
上例为单因素 ANOVA、4 组、中等效应 、功效 0.80 时的样本量规划;每组约需 45 个观测。
与 和 的关系
虽然 Cohen's f 基于 来定义,但 作为样本统计量是有偏的——它倾向于高估总体的真实效应量,尤其是在小样本中。因此,在效应量的实际报告与元分析中,更推荐使用omega 平方()或epsilon 平方()等修正估计量。
在单因素 ANOVA 中的定义为:
基于 可定义修正版本的 Cohen's f:
在大样本中 趋近于 ,两者计算的 f 差异可忽略;但在小样本研究中,基于 的 f 值更为保守,能更好地反映总体效应量,避免对功效的过度乐观估计。
局限性与注意事项
- 依赖方差齐性假设:Cohen's f 在 ANOVA 中假设各组方差相等。当方差齐性假设被违反时,基于 f 的功效分析可能失准,需使用 Welch 修正或稳健方法。
- 对非平衡设计敏感:在不等组设计中,各组样本量的差异会影响 的计算(Type I、II、III 平方和的选择),进而影响 f 的估计值。研究者需明确报告所使用的平方和类型。
- 基准的语境依赖性:如前所述,Cohen 的阈值是经验法则而非金科玉律。在元分析中,更推荐以该领域实际的效应量分布(如中位数 f 值)作为参考。
- 与 f² 的混淆:Cohen's f 和 Cohen's f² 是不同的指标——前者用于 ANOVA 和局部效应量,后者用于回归中单个预测变量的效应量()。两者数值上不直接可比。
- 功效分析的事后局限性:不应在数据收集后进行所谓的"事后功效分析"(post-hoc power analysis)并用观察到的 f 值来解释非显著结果——这种操作具有误导性。功效分析应在前瞻性研究设计中完成。
总结
Cohen's f 是方差分析及多元回归框架下度量效应量的标准工具。它通过将组间差异或模型解释力转化为标准化指标,使不同设计和研究之间的效果可比,并提供严格的功效分析与样本量规划依据。理解其定义、与 Cohen's d 及 的关系、以及恰当的使用与解读方式,对于开展严谨的定量研究至关重要。