ARTICLE
科恩f
科恩f(Cohen's f)是统计学家雅各布·科恩(Jacob Cohen)在其效应量(effect size)理论框架中提出的一个重要指标,用于衡量自变量对因变量的影响强度。与科恩d(Cohen's d,衡量两组均值差异)不同,科恩f专为方差分析(ANOVA)、多元回归和一般线性模型设计,尤其适用于存在多个分组或连续预测变量的场景。科恩f的本质是信号与噪声
科恩f(Cohen's f)是统计学家雅各布·科恩(Jacob Cohen)在其效应量(effect size)理论框架中提出的一个重要指标,用于衡量自变量对因变量的影响强度。与科恩d(Cohen's d,衡量两组均值差异)不同,科恩f专为方差分析(ANOVA)、多元回归和一般线性模型设计,尤其适用于存在多个分组或连续预测变量的场景。科恩f的本质是信号与噪声之比——它将组间变异(信号)与组内变异(噪声)相联系,为研究者提供了一种标准化的效应量度量方式,使其可以跨研究、跨样本进行效应大小的比较。
定义与公式
科恩f的基本公式为:
其中,(eta squared)是总体方差中由自变量解释的比例。当未知时,研究者也可以直接用组间平方和与组内平方和计算:
在多元回归和一般线性模型的语境下,科恩f的另一种常见表达形式为:
其中是回归模型的决定系数。此时直接反映了预测变量在解释了已有变异后,还能额外解释的变异比例与未解释变异之比。这一形式在功效分析(power analysis)和样本量规划中尤为常用。
效应大小的判断标准
科恩在1988年的经典著作中给出了科恩f的参考判断标准。对于方差分析,小、中、大三种效应量分别对应、和。在的语境下,小、中、大的标准则分别为、和。需要强调的是,科恩本人多次提醒这些标准仅为粗略参考,实际研究中效应量的大小应当结合具体学科领域的前沿经验来判断。在社会科学中,一个的中等效应已具有实质意义,而在实验物理学等领域,同样的数值可能被视为微乎其微。
与科恩d的区别
科恩d与科恩f虽然同属效应量家族,但两者的适用场景存在明显差异。科恩d衡量的是两组均值之差除以合并标准差,其公式为,适用于t检验和两组对比。科恩f则适用于两个以上分组的方差分析或包含多个预测变量的回归模型。从数学关系上看,当只有两个组时,科恩d与科恩f之间存在确定的转换关系:。这是因为在两组的特殊情况下,组间变异仅从一个自由度中产生,效应量被压缩。理解这一转换关系有助于研究者在不同分析框架之间保持效应量度量的连贯性。
在功效分析中的应用
科恩f最重要的应用领域之一是功效分析。研究者在设计实验时,通常需要回答一个问题:在预期效应量为某一数值的前提下,需要多大的样本量才能以足够高的统计功效(通常设定为0.80)检测出该效应?答案的得出离不开科恩f。在G*Power等功效分析软件中,用户只需输入效应量、显著性水平和期望功效,即可计算出所需总样本量。例如,在一个三组单因素方差分析中,若预期效应量为中等(),显著水平设为0.05,功效设为0.80,则约需159名被试(每组约53人)。若效应量降为小(),则所需样本量将骤增至约969人。这一鲜明的数量差异直观地展示了效应量对研究成本与可行性的巨大影响。
局限性
科恩f虽然应用广泛,但并非没有局限。第一,科恩f是一个总体层面的度量,无法揭示具体哪些组之间存在显著差异,研究者仍需借助事后检验做进一步分析。第二,科恩f对样本方差较为敏感,在异方差性强或存在异常值的样本中,其估计可能失真。第三,科恩f的参考标准具有主观性,不同学科、不同研究范式对"大""小"效应的定义差异悬殊。第四,在小样本条件下,科恩f的点估计可能存在向上偏误,建议研究者同时报告置信区间以反映估计的不确定性。
与其他效应量的关系
方差分析中的效应量体系除科恩f外还包括(eta squared)、(partial eta squared)和(omega squared)。是最直观的解释方差比例指标,但其在小样本中存在正偏误。通过引入误差项对进行了校正,因而在小样本中更为稳健。则适用于包含多个自变量的析因设计,它衡量的是某个特定自变量的净效应——在剔除其他自变量和交互项的影响后,该变量单独解释的变异比例。科恩f与这些指标之间可以相互转换:已知即可通过开方公式得到,已知亦可反推出。这种互操作性使得研究者可以在不同分析软件和报告规范之间灵活切换。
实证研究中的报告
近年来,心理学、教育学、医学等领域的学术期刊越来越多地要求作者报告效应量及其置信区间,而不仅仅是p值。科恩f作为方差分析和回归分析中最常用的效应量之一,其规范报告已成为学术写作的基本要求。美国心理学会(APA)在其出版手册中明确建议作者同时报告效应量和置信区间。研究者在使用科恩f时,应注明采用的是还是形式,并参照具体的判断标准对效应大小做出定性描述。此外,在元分析中,科恩f可以作为不同研究结果的标准化度量,使研究者能够将多个独立样本的效应量汇总为一个综合估计,从而得出更具普遍性的结论。
总结
科恩f是效应量理论中不可或缺的分析工具,它弥补了显著性检验仅提供"是否存在"而无法回答"影响有多大"的不足。通过将组间效应与组内变异的比值转换为标准化的度量,科恩f为研究者提供了一个跨研究可比、与功效分析无缝对接的效应量指标。理解科恩f的定义、计算、判断标准及其局限性,是从事定量研究的学者和数据分析人员的基本素养。在日益强调效应量报告和可重复性的当代科研环境中,科恩f的价值将继续凸显。