ARTICLE

Brown-Forsythe 检验

Brown-Forsythe 检验 Brown-Forsythe检验是一种用于检验多个组之间方差是否相等的统计方法,由Morton B. Brown和Alan B. Forsythe于1974年提出。该检验是Levene检验的一种改进版本,核心区别在于Brown-Forsythe检验使用各组的中位数而非均值作为中心位置的度量,因而对数据分布的偏态性和厚尾特征

浏览 0 更新 2026-01-07

Brown-Forsythe 检验

Brown-Forsythe检验是一种用于检验多个组之间方差是否相等的统计方法,由Morton B. Brown和Alan B. Forsythe于1974年提出。该检验是Levene检验的一种改进版本,核心区别在于Brown-Forsythe检验使用各组的中位数而非均值作为中心位置的度量,因而对数据分布的偏态性和厚尾特征具有更强的稳健性。在方差分析(ANOVA)中,方差齐性(homogeneity of variance)是关键的假设前提之一,Brown-Forsythe检验正是用于验证这一假设的常用工具。

基本思想与数学表述

Brown-Forsythe检验的原假设为所有组的总体方差相等,备择假设为至少有一组的方差与其他组不同。检验的基本思路是:若各组方差相等,则各组观测值与其组内中位数的绝对偏离程度应大致相当;反之,若某些组的偏离程度显著更大或更小,则表明方差存在差异。

设有 k 个组,第 i 组有 nin_i 个观测值,记第 i 组的中位数为 y~i\tilde{y}_i。定义绝对偏离值为:

zij=yijy~iz_{ij} = |y_{ij} - \tilde{y}_i|

其中 yijy_{ij} 为第 i 组第 j 个观测值。在此基础上,Brown-Forsythe检验统计量定义为:

W=(Nk)(k1)i=1kni(zˉizˉ)2i=1kj=1ni(zijzˉi)2W = \frac{(N - k)}{(k - 1)} \cdot \frac{\sum_{i=1}^k n_i (\bar{z}_{i\cdot} - \bar{z}_{\cdot\cdot})^2}{\sum_{i=1}^k \sum_{j=1}^{n_i} (z_{ij} - \bar{z}_{i\cdot})^2}

其中 zˉi\bar{z}_{i\cdot} 为第 i 组 zijz_{ij} 的均值,zˉ\bar{z}_{\cdot\cdot} 为所有 zijz_{ij} 的总均值,N = \sum nin_i 为总样本量。在原假设成立且各组样本量足够大的条件下,该统计量近似服从自由度为 (k-1, N-k) 的 F 分布。

与Levene检验的比较

Levene检验最初使用各组均值作为中心位置,但均值对极端值敏感,导致检验在数据呈现非正态分布时容易出现偏差。Brown和Forsythe的改进在于将均值替换为中位数,这一改变使检验统计量对偏离正态性的数据具有更好的稳健性。此外,Brown和Forsythe还提出可使用截尾均值(trimmed mean)作为替代方案,进一步增强了方法的灵活性。

在实际应用中,当数据分布呈现对称性时,基于均值的Levene检验与基于中位数的Brown-Forsythe检验表现相近;但当数据存在明显的偏态或厚尾特征时,Brown-Forsythe检验显著优于Levene检验,其实际第一类错误率更接近名义显著性水平。这一特性使得Brown-Forsythe检验在经济学、金融学、生物学和心理学等领域的实证研究中得到广泛应用。

应用场景与典型案例

方差分析的前提检验

Brown-Forsythe检验最常见的应用场景是作为方差分析(ANOVA)的前提检验。在单因素方差分析中,研究者需要验证各组数据的方差是否相等。若Brown-Forsythe检验的p值小于设定的显著性水平(通常为0.05),则拒绝方差齐性假设,此时应考虑使用Welch方差分析或非参数检验方法作为替代。

例如,在比较三种不同教学方法对学生成绩影响的实验中,研究者收集了三个班级的考试成绩。由于不同班级的学生基础可能存在差异,成绩分布可能呈现不同的离散程度。在运行ANOVA之前,使用Brown-Forsythe检验对方差齐性进行验证,能够有效避免因方差不等而导致的假阳性结论。

两独立样本t检验的假设验证

在双样本t检验中,方差齐性同样是重要前提。Brown-Forsythe检验可用于验证两组数据的方差是否相等。若检验结果显示方差不等,则应采用Welch校正t检验而非标准t检验。

金融波动率比较

在金融计量分析中,研究不同资产类别或不同市场阶段下的收益率波动率差异时,Brown-Forsythe检验具有独特的优势。金融收益率数据通常呈现尖峰厚尾和波动聚集特征,Levene检验在此类数据中可能产生偏差,而Brown-Forsythe检验由于使用中位数作为中心化度量,对极端收益率的敏感性较低,能够更可靠地比较各组的波动水平。

计算示例

以下通过一个简单的数值示例说明Brown-Forsythe检验的计算过程。假设有三组数据:

  • A组:2, 3, 5, 6, 9(中位数为5)
  • B组:1, 4, 4, 5, 6(中位数为4)
  • C组:3, 4, 6, 8, 9(中位数为6)

首先计算各组绝对偏离值:

  • A组:|2-5|=3, |3-5|=2, |5-5|=0, |6-5|=1, |9-5|=4 → 均值 zˉA\bar{z}_{A\cdot} = 2.0
  • B组:|1-4|=3, |4-4|=0, |4-4|=0, |5-4|=1, |6-4|=2 → 均值 zˉB\bar{z}_{B\cdot} = 1.2
  • C组:|3-6|=3, |4-6|=2, |6-6|=0, |8-6|=2, |9-6|=3 → 均值 zˉC\bar{z}_{C\cdot} = 2.0

总均值 zˉ\bar{z}_{\cdot\cdot} = (2.0 + 1.2 + 2.0) / 3 = 1.733

组间平方和:5 × [(2.0 - 1.733)² + (1.2 - 1.733)² + (2.0 - 1.733)²] = 5 × [0.071 + 0.284 + 0.071] = 5 × 0.426 = 2.13

组内平方和:A组 (3-2)² + (2-2)² + (0-2)² + (1-2)² + (4-2)² = 1+0+4+1+4 = 10;B组 (3-1.2)² + (0-1.2)² + (0-1.2)² + (1-1.2)² + (2-1.2)² = 3.24+1.44+1.44+0.04+0.64 = 6.8;C组 (3-2)² + (2-2)² + (0-2)² + (2-2)² + (3-2)² = 1+0+4+0+1 = 6;总和 = 22.8

统计量 W = (15-3)/(3-1) × (2.13/22.8) = 6 × 0.0934 = 0.560

在自由度为(2, 12)的F分布下,p值约大于0.05,因此不能拒绝原假设,即没有充分证据表明三组方差存在显著差异。

局限性

尽管Brown-Forsythe检验在稳健性方面优于Levene检验,但仍存在一定的局限性。首先,当各组样本量极不均衡时,检验的统计效力可能下降。其次,对于极小的样本量(如每组少于5个观测值),近似F分布的准确性可能不足。此外,Brown-Forsythe检验仅检验方差是否相等,而不能回答方差差异的方向或程度问题。在实际应用中,常需要结合描述性统计量(如标准差或四分位距)来全面评估各组变异性。

软件实现

主要统计软件均支持Brown-Forsythe检验。在R中,可使用\texttt{car}包中的\texttt{leveneTest()}函数,并通过设置\texttt{center = median}来执行Brown-Forsythe检验。在Python的\texttt{scipy.stats}中,\texttt{levene()}函数默认使用中位数作为中心化度量,因此直接调用即为Brown-Forsythe检验。SPSS和Stata在方差齐性检验模块中同样提供了该选项。研究者应根据数据特征和分析需求,合理选择检验方法,以确保统计推断的可靠性。

总结

Brown-Forsythe检验作为Levene检验的稳健改进版本,通过使用中位数替代均值作为中心化度量,有效降低了对数据分布假设的敏感性,是检验多组方差齐性的重要工具。其在方差分析前提验证、金融波动率比较及实验数据质量评估等领域均有广泛应用。理解该检验的数学原理、适用条件和局限性,对于正确进行统计推断和避免方法误用具有重要的实践意义。