ARTICLE

Levene检验

Levene检验 (Levene's Test) Levene检验(Levene's Test)是一种用于评估多个组之间方差是否相等的统计检验方法。它检验因变量在不同组别间的方差是否具有同方差性(Homoscedasticity),这是方差分析(ANOVA)和学生t检验的重要前提假设。Levene检验因其对数据偏离正态分布的稳健性而被广泛使用。 检验原理与假

浏览 60 更新 2025-10-26

Levene检验 (Levene's Test)

Levene检验(Levene's Test)是一种用于评估多个组之间方差是否相等的统计检验方法。它检验因变量在不同组别间的方差是否具有同方差性Homoscedasticity),这是方差分析ANOVA)和学生t检验的重要前提假设。Levene检验因其对数据偏离正态分布的稳健性而被广泛使用。

检验原理与假设

若方差不相等(即存在异方差性),使用标准ANOVA或t检验会增大犯第一类错误的概率。Levene检验的假设检验结构如下:

  • 零假设H0 H_0 :所有组的方差相等。 \[ H_0: \sigma_1^2 = \sigma_2^2 = \dots = \sigma_k^2 \] 其中 k k 为组数,σi2 \sigma_i^2 为第 i i 组的总体方差。
  • 备择假设Ha H_a :至少有一组的方差与其他组不相等。 \[ H_a: \exists i, j \text{ s.t. } \sigma_i^2 \neq \sigma_j^2 \]

通过p值判断:若 p > α \alpha (通常0.05),无法拒绝零假设,认为方差齐性成立;若 p α \leq \alpha ,拒绝零假设,方差齐性不成立。

计算步骤

Levene检验将对方差的检验转化为对均值的检验:计算每个数据点与其组中心的离差绝对值,再对离差做单因素方差分析。

第一步:定义数据。k k 个组,第 i i 组有 ni n_i 个观测值 Yij Y_{ij} ,总样本量 N=ni N = \sum n_i

第二步:计算组中心。原始Levene检验使用均值 Yˉi \bar{Y}_i ,但推荐使用对异常值更稳健的中位数 Y~i \tilde{Y}_i (此时称Brown-Forsythe检验),或截尾均值

第三步:计算离差绝对值。

Zij=Yij中心位置iZ_{ij} = |Y_{ij} - \text{中心位置}_i|

Zij Z_{ij} 代表原始数据与其组中心的离散程度。

第四步:对 Zij Z_{ij} 做ANOVA。检验统计量 W W 即ANOVA的 F F 统计量:

W=(Nk)(k1)i=1kni(ZˉiZˉ)2i=1kj=1ni(ZijZˉi)2W = \frac{(N-k)}{(k-1)} \frac{\sum_{i=1}^{k} n_i (\bar{Z}_{i\cdot} - \bar{Z}_{\cdot\cdot})^2}{\sum_{i=1}^{k} \sum_{j=1}^{n_i} (Z_{ij} - \bar{Z}_{i\cdot})^2}

其中 Zˉi \bar{Z}_{i\cdot} 为第 i i 组离差均值,Zˉ \bar{Z}_{\cdot\cdot} 为总均值。

第五步:判断。W W 服从F分布自由度df1=k1 df_1 = k-1 df2=Nk df_2 = N-k 。软件直接给出p值。

与巴特利特检验的比较

巴特利特检验(Bartlett's Test)是另一种方差齐性检验方法:

  • 巴特利特检验:在严格正态分布统计功效略高,但对非正态极其敏感,数据稍有偏离即可能错误拒绝零假设。
  • Levene检验:对偏离正态稳健,尤其使用中位数时。即使数据非完美正态,结果也相对可靠。

结论:实际数据很少完美正态,Levene检验通常是更安全、更常用的选择

实际应用考量

当Levene检验显示方差不齐(p α \leq \alpha )时,可采取:

  1. 使用调整自由度的检验:如韦尔奇t检验(Welch's t-test)或韦尔奇方差分析(Welch's ANOVA),对方差不等进行自由度校正。
  2. 数据转换:对数、平方根或倒数转换可能使数据满足方差齐性,但会改变解释尺度。
  3. 非参数检验:严重偏态且方差不齐时,可选用Kruskal-Wallis检验等不依赖分布假设的方法。

需注意:大样本下Levene检验可能过于敏感,微小且无实际意义的方差差异也会显著;小样本下则可能检验功效不足。因此解读结果应结合样本量和实际情境综合判断。