ARTICLE

Cohen's d

Cohen's d (科恩d值) Cohen's d是行为科学、心理学及众多社会科学领域中应用最广泛的标准化效应量(effect size)指标之一,由心理学家Jacob Cohen于1969年系统提出。该统计量通过将两组均值差异以标准差为单位进行标准化,从而提供一个无量纲的、可跨研究比较的度量,用于量化实验处理或组间差异的实质重要性。与p值仅反映统计显著性

浏览 0 更新 2025-11-08

Cohen's d (科恩d值)

Cohen's d是行为科学心理学及众多社会科学领域中应用最广泛的标准化效应量(effect size)指标之一,由心理学家Jacob Cohen于1969年系统提出。该统计量通过将两组均值差异以标准差为单位进行标准化,从而提供一个无量纲的、可跨研究比较的度量,用于量化实验处理或组间差异的实质重要性。与p值仅反映统计显著性不同,Cohen's d直接回答"效应有多大"这一更具科学意义的问题。

核心概念:标准化均值差异

设两组独立样本的均值分别为Xˉ1\bar{X}_1Xˉ2\bar{X}_2,原始未标准化差异Xˉ1Xˉ2\bar{X}_1 - \bar{X}_2的解读强烈依赖变量的测量尺度。Cohen's d通过引入标准化分母解决了这一量纲依赖问题:d=(Xˉ1Xˉ2)/sd = (\bar{X}_1 - \bar{X}_2)/s,其中ss合并标准差,计算公式为s=[(n11)s12+(n21)s22]/(n1+n22)s = \sqrt{[(n_1-1)s_1^2 + (n_2-1)s_2^2]/(n_1+n_2-2)}。该合并估计量假设两组具有相同总体方差的方差齐性——当该假设不成立时需采用Welch校正法。

Cohen基于对心理学文献的实证分析提出了广泛引用的经验解释标准:小效应d0.2|d| \approx 0.2——两组分布约85\%重叠,差异虽可检测但肉眼难察觉;中等效应d0.5|d| \approx 0.5——分布重叠约67\%,代表可感知的实质差异;大效应d0.8|d| \approx 0.8——分布重叠降至约53\%,差异清晰可见且具有重要实践价值。需强调这些阈值仅为启发式指南,效应量的实际意义必须结合研究领域的理论背景和实际应用场景进行情境化解读。

与统计显著性的区别及计算变体

Cohen's d与t检验产生的p值构成互补关系但度量截然不同的维度。统计显著性(p值)受样本量影响极大:大样本下即使d=0.01d = 0.01也可能统计显著,小样本下d=0.8d = 0.8的重要效应可能因检验力不足而不显著。Cohen's d作为点估计直接反映效应的尺度,其抽样误差可通过置信区间量化——例如报告d=0.50d = 0.50 [95\% CI: 0.35, 0.65],表明95\%置信水平下真实效应介于中小效应之间。这种区分对纠正p值操纵和统计显著性崇拜至关重要,顶级期刊如今普遍要求报告效应量及其置信区间。

计算变体包括:独立样本设计的经典公式,当样本量相等时合并标准差简化为(s12+s22)1/2/2(s_1^2 + s_2^2)^{1/2} / \sqrt{2}。配对样本设计采用差异分数的标准差sDs_D作为分母——dz=(Xˉ1Xˉ2)/sDd_z = (\bar{X}_1 - \bar{X}_2)/s_D,反映配对内部变化的效应量。此外还有针对小样本偏误的Hedges' g修正:当n1+n2n_1+n_2较小时g=d[13/(4n1+4n29)]g = d \cdot [1 - 3/(4n_1+4n_2-9)]提供更无偏的效应量估计。在元分析(meta-analysis)中,Cohen's d是标准化效应量的常用指标,用于跨研究汇总和比较不同测量工具下的干预效应。Cohen's d现已成为统计推断中连接统计显著性与实践重要性的核心桥梁工具。