ARTICLE

Cohen's d

Cohen's d (科恩d值) Cohen's d是行为科学、心理学及众多社会科学领域中应用最广泛的标准化效应量（effect size）指标之一，由心理学家Jacob Cohen于1969年系统提出。该统计量通过将两组均值差异以标准差为单位进行标准化，从而提供一个无量纲的、可跨研究比较的度量，用于量化实验处理或组间差异的实质重要性。与p值仅反映统计显著性

浏览 0 更新 2025-11-08

Cohen's d (科恩d值)

Cohen's d是行为科学、心理学及众多社会科学领域中应用最广泛的标准化效应量（effect size）指标之一，由心理学家Jacob Cohen于1969年系统提出。该统计量通过将两组均值差异以标准差为单位进行标准化，从而提供一个无量纲的、可跨研究比较的度量，用于量化实验处理或组间差异的实质重要性。与p值仅反映统计显著性不同，Cohen's d直接回答"效应有多大"这一更具科学意义的问题。

核心概念：标准化均值差异

设两组独立样本的均值分别为 $\bar{X}_1$ 和 $\bar{X}_2$ ，原始未标准化差异 $\bar{X}_1 - \bar{X}_2$ 的解读强烈依赖变量的测量尺度。Cohen's d通过引入标准化分母解决了这一量纲依赖问题： $d = (\bar{X}_1 - \bar{X}_2)/s$ ，其中 $s$ 为合并标准差，计算公式为 $s = \sqrt{[(n_1-1)s_1^2 + (n_2-1)s_2^2]/(n_1+n_2-2)}$ 。该合并估计量假设两组具有相同总体方差的方差齐性——当该假设不成立时需采用Welch校正法。

Cohen基于对心理学文献的实证分析提出了广泛引用的经验解释标准：小效应 $|d| \approx 0.2$ ——两组分布约85\%重叠，差异虽可检测但肉眼难察觉；中等效应 $|d| \approx 0.5$ ——分布重叠约67\%，代表可感知的实质差异；大效应 $|d| \approx 0.8$ ——分布重叠降至约53\%，差异清晰可见且具有重要实践价值。需强调这些阈值仅为启发式指南，效应量的实际意义必须结合研究领域的理论背景和实际应用场景进行情境化解读。

与统计显著性的区别及计算变体

Cohen's d与t检验产生的p值构成互补关系但度量截然不同的维度。统计显著性（p值）受样本量影响极大：大样本下即使 $d = 0.01$ 也可能统计显著，小样本下 $d = 0.8$ 的重要效应可能因检验力不足而不显著。Cohen's d作为点估计直接反映效应的尺度，其抽样误差可通过置信区间量化——例如报告 $d = 0.50$ [95\% CI: 0.35, 0.65]，表明95\%置信水平下真实效应介于中小效应之间。这种区分对纠正p值操纵和统计显著性崇拜至关重要，顶级期刊如今普遍要求报告效应量及其置信区间。

计算变体包括：独立样本设计的经典公式，当样本量相等时合并标准差简化为 $(s_1^2 + s_2^2)^{1/2} / \sqrt{2}$ 。配对样本设计采用差异分数的标准差 $s_D$ 作为分母—— $d_z = (\bar{X}_1 - \bar{X}_2)/s_D$ ，反映配对内部变化的效应量。此外还有针对小样本偏误的Hedges' g修正：当 $n_1+n_2$ 较小时 $g = d \cdot [1 - 3/(4n_1+4n_2-9)]$ 提供更无偏的效应量估计。在元分析（meta-analysis）中，Cohen's d是标准化效应量的常用指标，用于跨研究汇总和比较不同测量工具下的干预效应。Cohen's d现已成为统计推断中连接统计显著性与实践重要性的核心桥梁工具。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。