ARTICLE

莱文检验

莱文检验 (Levene's Test) 莱文检验(Levene's test)是一种广泛应用于统计学的方差齐性检验(homogeneity of variance test),由美国统计学家霍华德·莱文(Howard Levene)于1960年提出。其主要用途是检验两组或多组样本的方差是否相等,是方差分析(ANOVA)和t检验等参数检验方法中方差齐性假设的

浏览 0 更新 2025-10-26

莱文检验 (Levene's Test)

莱文检验(Levene's test)是一种广泛应用于统计学方差齐性检验(homogeneity of variance test),由美国统计学家霍华德·莱文(Howard Levene)于1960年提出。其主要用途是检验两组或多组样本的方差是否相等,是方差分析(ANOVA)和t检验等参数检验方法中方差齐性假设的重要前置诊断工具。与经典的巴特利特检验(Bartlett's test)相比,莱文检验对数据偏离正态分布的敏感性更低,因此在实际应用中更为稳健,尤其适合处理经济学和金融学中常见的非正态数据。

检验原理与统计量

莱文检验的原假设 H0H_0 为各组的总体方差相等,备择假设 H1H_1 为至少有一组的方差与其他组不同。检验的核心思路并非直接比较原始数据的方差,而是对经过中心化后的绝对离差(absolute deviations)进行方差分析。这一巧妙转化将方差比较问题转化为均值比较问题,从而可以利用 ANOVA 框架的成熟理论。

具体而言,设共有 kk 组样本,第 ii 组有 nin_i 个观测值 xi1,xi2,,xinix_{i1}, x_{i2}, \dots, x_{in_i}。首先计算各观测值相对于组中心的位置。中心化方式决定了莱文检验的具体变体:最常用的是以组均值为中心的标准莱文检验,即计算 zij=xijxˉiz_{ij} = |x_{ij} - \bar{x}_i|,其中 xˉi\bar{x}_i 是第 ii 组的均值。莱文本人同时提出了以组中位数为中心的变体,即 zij=xijx~iz_{ij} = |x_{ij} - \tilde{x}_i|。这种做法由布朗和福赛思(Brown \& Forsythe)于1974年进一步推广,通常称为布朗-福赛思检验(Brown-Forsythe test),对偏态分布的稳健性更佳。此外还有以截尾均值(trimmed mean)为中心的变体,在数据中存在极端异常值时表现良好。随后,以 zijz_{ij} 为因变量进行单因素方差分析,计算 FF 统计量:

W=(Nk)i=1kni(zˉizˉ)2(k1)i=1kj=1ni(zijzˉi)2W = \frac{(N - k) \sum_{i=1}^{k} n_i (\bar{z}_i - \bar{z})^2}{(k - 1) \sum_{i=1}^{k} \sum_{j=1}^{n_i} (z_{ij} - \bar{z}_i)^2}

其中 zˉi\bar{z}_i 是第 ii 组绝对离差的均值,zˉ\bar{z} 是所有绝对离差的总体均值,N=niN = \sum n_i 为总样本量。在原假设下,WW 近似服从自由度为 (k1,Nk)(k-1, N-k)FF 分布。若 WW 大于给定显著性水平下的临界值,则拒绝方差齐性的原假设。分子衡量的是组间绝对离差的变异程度,分母衡量的是组内绝对离差的变异程度,当各组的方差差异越大时,WW 统计量也越大。

性质与适用条件

莱文检验最突出的优势在于其对正态性假设的低敏感性。巴特利特检验虽然对正态数据有较高的检验功效,但一旦数据偏离正态分布,其检验结果极易出现虚高的一类错误率。相比之下,莱文检验基于绝对离差的 ANOVA 框架利用了中心极限定理的稳健性,即使数据来自厚尾或偏态分布,检验的实际显著性水平也能较好地维持在名义水平附近。这一性质使得莱文检验成为金融数据(如收益率序列通常呈现尖峰厚尾特征)分析中的首选工具。布朗-福赛思变体(使用中位数)对极端值更为稳健,是处理含有异常值的实证数据时的首选方案。

然而,莱文检验也存在局限性。当样本量较小时,检验功效(power)相对不足,即方差存在实质性差异时检验仍可能不显著。此外,莱文检验本质上是一个联合检验,仅能判断是否存在至少一组方差异常,但无法直接定位具体是哪几组之间存在差异。在多重比较场景下,研究者需结合方差分析后的事后检验方法(如图基检验)进一步分析。此外,当各组样本量严重失衡时,莱文检验的稳健性也会受到一定影响。

与巴特利特检验的比较

巴特利特检验是另一种常用的方差齐性检验方法,其检验统计量基于各组样本方差的对数加权和,在原假设下近似服从自由度为 k1k-1卡方分布。巴特利特检验在数据满足正态性假设时具有最高的检验功效,但其对正态性偏离极为敏感——即使数据与正态分布仅有微小偏离,检验结果也可能显著失真。有模拟研究表明,在数据来自t分布(自由度为5)的情况下,巴特利特检验的实际一类错误率可高达名义水平的2至3倍,而莱文检验的实际一类错误率仍保持在名义水平附近。因此,莱文检验被多数统计教材和软件包推荐为方差齐性检验的默认方法。主流统计软件如 R 语言中的 \texttt{car::leveneTest()} 函数和 Python 的 \texttt{scipy.stats.levene()} 函数都提供了莱文检验的多种变体实现。

在计量经济学中的应用

计量经济学生物统计学中,莱文检验广泛应用于以下场景。其一,在进行独立样本t检验方差分析之前,检验不同处理组或不同分类水平下方差是否齐性。若检验显著,则需采用方差异质性校正方法(如 Welch 的 t 检验或 Welch 的 ANOVA),这些方法不要求方差齐性假设。其二,在回归分析中,莱文检验可用于初步诊断异方差性(heteroscedasticity),即残差方差是否随预测变量或组别而系统变化。虽然专门的怀特检验(White's test)和布罗施-帕甘检验(Breusch-Pagan test)在连续型预测变量场景下更为常用,但莱文检验在分组异方差场景下具有直观且易于解释的优势。其三,在实验设计中,方差齐性是随机区组设计因子设计处理效应估计有效性的前提,莱文检验为该前提提供了统计依据。其四,在双重差分法(Difference-in-Differences, DID)等政策评估方法中,处理组和对照组在政策干预前的结果变量方差是否相等,也是平行趋势假设之外的另一个重要诊断维度。