ARTICLE
Glass's Δ
Glass's Δ Glass's Δ(Glass's delta,又称 Glass 效应量)是一种用于衡量两组均值差异的效应量指标,由统计学家 Gene V. Glass 于 1976 年提出。与 Cohen's d 不同,Glass's Δ 仅使用控制组(对照组)的标准差作为标准化基准,而非合并标准差。这一设计使其在元分析和实验研究中具有独特的优势,尤其
Glass's Δ
Glass's Δ(Glass's delta,又称 Glass 效应量)是一种用于衡量两组均值差异的效应量指标,由统计学家 Gene V. Glass 于 1976 年提出。与 Cohen's d 不同,Glass's Δ 仅使用控制组(对照组)的标准差作为标准化基准,而非合并标准差。这一设计使其在元分析和实验研究中具有独特的优势,尤其在处理组方差异于控制组的场景下更为稳健。
定义与公式
Glass's Δ 的数学定义为:
其中 为处理组的样本均值, 为控制组的样本均值, 为控制组的样本标准差。该公式将处理组与控制组之间的均值差异以控制组的标准差为单位进行标准化,从而得到无量纲的效应量估计值。
与 Cohen's d 的对比
Glass's Δ 与 Cohen's d 最大的区别在于分母的选择。Cohen's d 使用合并标准差(pooled standard deviation),即假设两组方差齐性时最优的方差估计量。然而,当处理组本身可能影响方差(例如某种药物不仅改变均值,还可能改变个体间的变异程度)时,合并标准差会将处理组中受到干预影响的变异信息纳入标准化基准,从而扭曲效应量的解释。Glass's Δ 通过仅使用控制组的标准差,避免了这一问题,使效应量的标准化基准保持"未受干预"的状态。
从统计推断的角度看,当方差齐性假设成立时,Glass's Δ 与 Cohen's d 的差异不大;但当方差异质时,Glass's Δ 提供了一种更保守且更可解释的标准化方式。此外,Glass's Δ 的抽样分布通常比 Cohen's d 更复杂,因为分母的估计仅依赖于控制组,而非两组的合并信息。
适用场景
Glass's Δ 最常用于元分析(meta-analysis),特别是在医学、心理学和社会科学领域的综合研究中。在元分析中,不同研究的处理组可能受到不同强度的干预,导致处理组方差产生系统性变化,此时使用 Cohen's d 会引入研究间的异质性偏差,而 Glass's Δ 可提供更一致的效应量指标。
此外,在实验研究设计中,当研究者有充分理由相信处理干预可能改变结果变量的方差结构时(例如教育干预可能同时拉高成绩和缩小差距),优先选择 Glass's Δ 而非合并标准化的指标更为妥当。
统计性质
Glass's Δ 是无量纲的标准化效应量指标,其取值范围覆盖整个实数轴。Δ > 0 表示处理组均值高于控制组,Δ < 0 表示处理组均值低于控制组。在解释上,Δ = 0.5 表示处理组均值高出控制组半个控制组标准差,Δ = 0.8 通常被视为大效应量的经验阈值。
Glass's Δ 的方差估计公式为:
其中 为处理组样本量, 为控制组样本量。该近似公式在大样本条件下具有较好的准确性,可用于构建 Glass's Δ 的置信区间和进行假设检验。
小样本偏差校正
与 Cohen's d 类似,Glass's Δ 在小样本条件下存在向上偏差。由于控制组标准差 是总体标准差的向下有偏估计(尤其在样本量较小时),Glass's Δ 作为比值统计量会系统性地高估真实效应量。常见的校正方法包括使用无偏标准差估计(即使用 n − 1 分母的标准差,这已是标准做法)以及在元分析中采用 Hedges 校正因子对效应量进行调整。
在元分析中的角色
Glass's Δ 在元分析中扮演着特殊角色。Glass 本人是元分析方法的奠基人之一,他提出该指标正是为了解决元分析中不同研究使用不同测量工具时效应量的可比性问题。当各研究采用不同的量表或测试工具衡量同一构念时,原始均值差异无法直接比较,而 Glass's Δ 通过标准化提供了统一的量纲。在实践操作中,元分析研究者常常同时报告 Glass's Δ 和 Cohen's d,以展示不同标准化选择对综合效应量估计的敏感性。
软件实现
主流统计软件均支持 Glass's Δ 的计算。在 R 语言中,\texttt{effsize} 包和 \texttt{metafor} 包提供了专门的函数(如 \texttt{glass.delta} 函数),可直接计算 Glass's Δ 及其置信区间。在 Stata 中,\texttt{esize} 命令配合相应选项也能输出 Glass's Δ 估计值。Python 的 \texttt{scipy.stats} 和 \texttt{pingouin} 库同样支持该指标的计算。研究者在使用时应注意确认软件默认使用的是控制组标准差还是合并标准差,以避免误用。
局限性
Glass's Δ 并非在所有场景下都优于其他效应量指标。当控制组样本量过小时,控制组标准差本身估计不精确,会导致 Glass's Δ 的不稳定性显著上升。此外,在非实验性的观察研究中,"控制组"的概念往往不明确,此时 Glass's Δ 的适用性受到限制。研究者应根据具体研究问题、研究设计和数据特征,审慎选择效应量指标,而非机械套用。
实际应用案例
考虑一项评估新教学方法对数学成绩影响的教育实验。实验组采用新教学法,对照组沿用传统方法。如果新教学法不仅提升了平均成绩,还缩小了学生之间的成绩差距(即降低了方差),那么使用 Cohen's d 会因合并标准差的增大而低估效应量。此时 Glass's Δ 仅以对照组的原始方差为基准,能更准确地反映教学干预的实际效果。这一特征在心理健康干预研究中也尤为突出——许多心理治疗不仅改变症状均值,还会影响症状的变异程度,Glass's Δ 在此类研究中被广泛推荐使用。
总结
Glass's Δ 作为元分析之父 Glass 提出的经典效应量指标,以控制组标准差为基准的处理方式,在效应量家族中占据独特地位。它与 Cohen's d、Hedges's g 共同构成了标准化效应量的三大主流指标,各自适用于不同的研究情境。研究者应根据数据的方差结构、研究设计类型以及元分析的综合需求做出合理选择。在实际报告中,同时报告多种效应量指标并进行敏感性分析,是提升研究透明度和可重复性的最佳实践。
总体而言,Glass's Δ 以其对控制组标准差的专注使用,在方差异质场景和元分析应用中提供了不可替代的视角和方法工具。