ARTICLE

Levene's检验

Levene's检验 (Levene's Test) Levene's检验(Levene's Test),或称莱文检验,是一种在统计学中广泛使用的方差齐性检验(Homogeneity of Variance Test)方法。它的主要目的是检验两个或多个总体的方差是否相等,即判断来自不同组的样本数据是否具有相同的变异程度。该检验由美国统计学家Howard Le

浏览 0 更新 2025-11-08

Levene's检验 (Levene's Test)

Levene's检验(Levene's Test),或称莱文检验,是一种在统计学中广泛使用的方差齐性检验(Homogeneity of Variance Test)方法。它的主要目的是检验两个或多个总体方差是否相等,即判断来自不同组的样本数据是否具有相同的变异程度。该检验由美国统计学家Howard Levene于1960年正式提出,作为参数检验中方差齐性假设的稳健检验工具。

在统计分析中,许多经典的参数检验方法(如ANOVA(方差分析)和t检验)都假定各组的总体方差相等,这一假定被称为方差齐性(Homoscedasticity)。当这一假定被违反时,检验的第一类错误率(Type I Error Rate)和统计功效(Statistical Power)都会受到影响。Levene's检验正是为此场景提供了一种系统性的判断依据。

与Bartlett检验的比较

Levene's检验的提出,在一定程度上是为了弥补Bartlett检验(Bartlett's Test)的不足。Bartlett检验是另一种常用的方差齐性检验方法,但它对数据来自正态分布的假定非常敏感——当数据偏离正态性时,Bartlett检验很容易错误地拒绝零假设,即误判方差不相等。

相比之下,Levene's检验对总体分布的非正态性具有更强的稳健性(Robustness)。它不要求数据严格服从正态分布,因此在实际应用中更为可靠。这一特性使得Levene's检验成为许多统计软件(如SPSSR语言Python的SciPy库)中方差齐性检验的默认或推荐方法。

检验的零假设与备择假设

Levene's检验的零假设和备择假设分别为:

  • 零假设 H0 H_0 :所有组的总体方差相等,即 σ12=σ22==σk2 \sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2
  • 备择假设 H1 H_1 :至少有一组的总体方差与其他组不同。

该检验本质上是对各组方差差异的显著性进行判断。当检验的p值小于给定的显著性水平 α \alpha (通常为0.05)时,拒绝零假设,表明方差不满足齐性条件。

三种变形:均值、中位数与截尾均值

Levene's检验的核心思想并不直接比较各组方差,而是对原始数据进行某种形式的转换(Transformation),然后对转换后的数值进行单因素方差分析(One-Way ANOVA)。根据转换时使用的中心化指标不同,Levene's检验有三种主要变体:

  1. 基于均值的Levene检验(Levene's Test using Mean):使用各组均值(Mean)作为中心,计算每个观测值与组均值的绝对偏差。这是最原始的版本,但当数据分布严重偏态时,其稳健性可能下降。
  1. 基于中位数的Levene检验(Brown-Forsythe Test):使用各组中位数(Median)代替均值。这一版本由Morton B. BrownAlan B. Forsythe于1974年提出,通常被称为Brown-Forsythe检验。它比基于均值的版本更加稳健,尤其适用于偏态分布或存在离群值(Outliers)的数据,是实践中推荐的默认选择。
  1. 基于截尾均值的Levene检验:使用各组的截尾均值(Trimmed Mean,即去掉两端一定比例极端值后的均值)。这一版本在稳健性和统计功效之间取得了一定的折中。

其中,Brown-Forsythe检验(基于中位数)因其出色的稳健性,在实际应用中最为广泛。

Levene's检验的计算步骤

Levene's检验的计算过程可以概括为以下几个步骤:

第一步:计算组内中心化指标

对于 k k 个组,分别计算每组数据的中心化指标 Mi M_i 。根据选择的变体,Mi M_i 可以是第 i i 组的均值 Yˉi \bar{Y}_i 、中位数 Y~i \tilde{Y}_i 或截尾均值。

第二步:计算绝对偏差

对每一个观测值 Yij Y_{ij} (第 i i 组第 j j 个观测值),计算其与组内中心化指标的绝对偏差:

Zij=YijMiZ_{ij} = | Y_{ij} - M_i |

第三步:对绝对偏差进行单因素方差分析

将计算得到的绝对偏差 Zij Z_{ij} 作为新的响应变量,以原始的分组变量作为因子,进行单因素方差分析(One-Way ANOVA)。所得到的F统计量即为Levene's检验的检验统计量:

W=(Nk)i=1kni(ZiZ)2(k1)i=1kj=1ni(ZijZi)2W = \frac{(N - k) \sum_{i=1}^{k} n_i (Z_{i\cdot} - Z_{\cdot\cdot})^2}{(k - 1) \sum_{i=1}^{k} \sum_{j=1}^{n_i} (Z_{ij} - Z_{i\cdot})^2}

其中 ni n_i 是第 i i 组的样本量,N N 是总样本量,Zi Z_{i\cdot} 是第 i i 组绝对偏差的均值,Z Z_{\cdot\cdot} 是所有观测绝对偏差的总均值。

第四步:做出统计推断

在零假设成立的情况下,检验统计量 W W 近似服从 F(k1,Nk) F(k-1, N-k) 分布。根据计算得到的p值判断是否拒绝零假设。

应用场景与重要性

Levene's检验在统计实践中具有广泛的应用场景:

  • 方差分析(ANOVA)的前提检验:在进行单因素或多因素方差分析之前,可以使用Levene's检验验证方差齐性假定是否满足。如果检验显著(方差不齐),则可以考虑使用Welch's ANOVA或对数据进行变换。
  • 独立样本t检验的辅助判断:在进行独立样本t检验时,需要判断两组的方差是否相等,以决定使用标准t检验还是Welch t检验。
  • 质量控制:在工业统计中,Levene's检验可用于比较不同批次或不同生产过程的产品变异程度是否一致。
  • 生物医学研究:在比较不同处理组的生物指标变异时,Levene's检验可以帮助判断处理是否影响了个体间的变异程度。

局限性与注意事项

尽管Levene's检验比Bartlett检验更加稳健,但它也有一些需要注意的局限性:

  1. 对严重偏态的敏感性:当数据极度偏态或存在大量离群值时,即使是基于中位数的Brown-Forsythe检验也可能产生偏差。
  2. 样本量影响:与大多数假设检验一样,当样本量很大时,Levene's检验可能检测到微小的、实际不重要的方差差异;而当样本量很小时,它可能缺乏足够的统计功效来检测出有实际意义的方差差异。
  3. 非独立数据:Levene's检验适用于独立样本。对于配对数据或重复测量数据,应使用其他专门设计的方差齐性检验方法。

替代方法

当Levene's检验的假定无法满足时,研究人员可以考虑以下替代方案:

  • Fligner-Killeen检验(Fligner-Killeen Test):一种非参数(Nonparametric)的方差齐性检验方法,对非正态性极其稳健。
  • Welch's ANOVA:不要求方差齐性的ANOVA修正版本,可以直接在方差不齐的情况下使用。
  • 数据变换:对原始数据进行对数变换、平方根变换或Box-Cox变换,以达到方差稳定的目的。

总结

Levene's检验是统计推断中不可或缺的诊断工具。它为评估方差齐性这一关键假定提供了一种相对稳健的方法,尤其以Brown-Forsythe变体(基于中位数)最为实用。正确使用Levene's检验可以帮助研究者避免因违反方差齐性假定而导致的错误统计推断,从而提升分析结论的可靠性和有效性。在实际的数据分析工作中,Levene's检验已成为检验方差齐性的标准工具之一,被广泛集成于各类统计软件和编程语言中。