ARTICLE
谢费检验
谢费检验 (Scheffé's Test) 谢费检验(Scheffé's Test,又称Scheffé方法)是由美国统计学家Henry Scheffé于1953年提出的一种多重比较(Multiple Comparisons)方法,主要用于方差分析(ANOVA)拒绝原假设后,对处理均值之间的任意对比(contrast)进行事后检验。与Tukey HSD检验、B
谢费检验 (Scheffé's Test)
谢费检验(Scheffé's Test,又称Scheffé方法)是由美国统计学家Henry Scheffé于1953年提出的一种多重比较(Multiple Comparisons)方法,主要用于方差分析(ANOVA)拒绝原假设后,对处理均值之间的任意对比(contrast)进行事后检验。与Tukey HSD检验、Bonferroni校正等仅限制于成对比较的方法不同,谢费检验的最大特点是它允许研究者检验所有可能的线性对比——包括成对比较、组间平均的比较、以及任意线性组合——同时严格控制族系错误率(Familywise Error Rate, FWER)。这种全局保护能力使得谢费检验成为多重比较领域最为保守但最通用的方法,尤其适用于探索性数据分析中事先未计划好的复杂对比。
基本原理与数学形式
考虑单因素方差分析模型 ,其中 为处理组数, 为每组观测数, 为独立同分布的随机误差。令对比(contrast)定义为系数向量 满足 的线性组合 。谢费检验的理论基础是:在所有可能的对比中,被估计对比的平方和与误差均方的比值遵循一个由F分布放大的分布。
具体而言,对于任意对比 ,其点估计为 ,方差为 。谢费检验构建的置信区间为:
其中 为组内均方误差, 为总样本量, 为F分布的临界值。这一区间保证:在所有可能的对比中,同时覆盖真实对比的概率为 。换言之,若一个对比的置信区间不包含0,则可在FWER控制下认定该对比具有统计显著性。
谢费检验的检验统计量等价于:
将此统计量与临界值 比较。这一构造的核心思想是:谢费用Sidak不等式和Cauchy-Schwarz不等式证明了,在多元正态均值空间中,对全体对比的无穷多个检验可以通过单一F分布临界值统一控制。
与Tukey HSD和Bonferroni检验的比较
谢费检验、Tukey HSD和Bonferroni校正共同构成多重比较的三大经典方法,三者之间存在层次分明的适用场景差异:
- Tukey HSD:专为所有成对比较设计,利用学生化极差(Studentized Range)分布构造精确联合置信区间。当研究目的仅为比较每对处理均值之间的差异时,Tukey方法提供了最窄的置信区间和最高的检验功效。
- Bonferroni校正:通过将各比较的显著性水平调整为 ( 为比较总数)来控制FWER。该方法极其灵活,适用于任意有限数量的比较,但当比较数量很大时过于保守。
- 谢费检验:适用于所有可能的线性对比——包括那些研究者事先未设想、事后才想检验的复杂对比。谢费检验不仅涵盖成对比较,还允许检验诸如"前三组均值等于后三组均值"或"处理组的线性趋势"等复杂假设。正是由于它需要保护无穷多个对比,其临界值在所有方法中最大,对成对比较而言最为保守。
一个重要的理论结果是:在检验所有成对比较时,谢费检验的临界值始终不小于Tukey HSD的临界值。这意味着若研究者的兴趣仅限于成对比较,谢费检验会不必要地损失检验功效。然而,当研究者需要进行非成对的复杂对比时(例如因子实验中的交互效应解读、剂量-反应关系的趋势检验),谢费检验提供了独一无二的全局保护。
适用条件与使用场景
谢费检验的适用条件与方差分析完全一致:各组的观测独立,每组内的误差服从正态分布,且各组方差齐性。在样本量不相等(非平衡设计)时,谢费检验仍然有效,且不要求各组样本量相等——它天然适应非平衡设计,这是其相对于Tukey HSD(Tukey-Kramer修正也可处理非平衡设计)的另一个优势。
谢费检验最常见的应用场景包括:
- 事后探索性分析:当方差分析拒绝原假设后,研究者希望自由探索各种可能的对比结构,而非仅限于预设的成对比较。例如在农业试验中,比较若干肥料处理的平均产量后,进一步检验"有机肥组合的平均产量是否等于化肥组合的平均产量"。
- 因子交互作用的后续分析:在双因素或多因素方差分析中,若交互项显著,谢费检验可用于检验简单效应(simple effects)的任意对比组合,而无需对比较次数做额外惩罚。
- 趋势检验:当处理水平有序时(如不同剂量水平),谢费检验可检验线性、二次乃至更高阶的多项式对比,从而揭示均值随处理水平变化的模式特征。
- 回归系数的联合检验:在线性回归框架中,谢费检验等同于对一组回归系数的联合F检验,可用于检验任意线性假设 。
局限性与其他事后检验方法
谢费检验最主要的局限在于其对成对比较的保守性。当比较数量较少且研究者仅关心成对差异时,Tukey HSD或Dunnett检验(适用于所有处理与一个对照的比较)是更优选择。此外,若事先已经明确计划好特定的有限数量对比,正交对比(Orthogonal Contrasts)或带Bonferroni校正的对比检验可以在保持FWER控制的同时提供更高的功效。
现代多重比较方法的发展也提供了谢费检验之外的新选择。假发现率(False Discovery Rate, FDR)控制方法(如Benjamini-Hochberg过程)适用于比较数量很大时的探索性研究,它放宽了对FWER的严格保护,换取更高的发现能力。然而,在需要严格保证至少有一个错误拒绝的概率不超过的确认性研究(如临床试验、监管审批)中,谢费检验所代表的FWER控制方法仍是不可替代的标准。
总体而言,谢费检验以其对全体线性对比的同时推断能力,在多重比较方法库中占据独特位置。它牺牲了对特定比较的最优性,换取了无与伦比的通用性与全局保护,是从事探索性数据分析的统计学家和经济学家必须掌握的稳健工具。