ARTICLE
Brown-Forsythe检验
Brown-Forsythe检验 (Brown-Forsythe Test) Brown-Forsythe检验 (Brown-Forsythe Test) 是一种用于检验多个总体之间是否存在方差齐性 (Homogeneity of Variances) 的统计方法。它由 Morton B. Brown 和 Alan B. Forsythe 于 1974 年提
Brown-Forsythe检验 (Brown-Forsythe Test)
Brown-Forsythe检验 (Brown-Forsythe Test) 是一种用于检验多个总体之间是否存在方差齐性 (Homogeneity of Variances) 的统计方法。它由 Morton B. Brown 和 Alan B. Forsythe 于 1974 年提出,本质上是对经典的 Levene检验 (Levene's Test) 的一项重要改良:计算每个观测值与其所在组中心位置的绝对离差时,将 Levene 检验中使用的组均值替换为中位数或修整均值。这一看似微小的改变,使得 Brown-Forsythe 检验在处理来自偏态分布或包含离群值的数据时,表现得更为稳健 (Robust)。
在计量经济学、生物统计学和心理学等领域的实践中,Brown-Forsythe 检验常作为方差分析 (ANOVA) 或线性回归分析前的预检验步骤,用于判断各组数据的方差是否一致——这是许多经典统计方法的前提假设之一。
统计背景与动机
在许多经典统计推断方法中,方差齐性假设都是核心前提。例如:
如果方差齐性假设被严重违反,上述方法的 I型错误率和统计功效都可能受到影响。因此,在正式进行组间均值比较之前,研究者通常需要先检验方差的同质性。最经典的方差齐性检验包括 Bartlett检验 (Bartlett's Test) 和 Levene 检验。然而,Bartlett 检验对数据偏离正态分布极为敏感,如果总体分布稍有偏斜或具有厚尾特征,Bartlett 检验的实际 I 型错误率就会严重偏离名义水平。
Levene 检验通过比较各组内绝对离差而非原始观测值,显著改善了对非正态数据的稳健性,但它使用的组均值作为中心化指标,在分布偏斜时仍可能不够理想。Brown 和 Forsythe 在 1974 年的蒙特卡洛模拟研究中证实:将组均值替换为中位数或 10\% 修整均值,能进一步提升检验在面对重尾分布(如柯西分布、t分布的低自由度情形)和偏态分布时的稳健性,同时不显著损失在正态条件下的检验效能。
检验的零假设与备择假设
设我们有 个独立的组别,第 组包含 个观测值,总样本量 。记第 组的总体方差为 。
检验步骤的详细展开
Brown-Forsythe 检验的运算流程如下:
第一步:选择中心化指标并计算绝对离差
对于第 组中的第 个观测值 ,计算该观测值与其所在组中心 的绝对离差:
其中,中心化指标 的选取决定了检验的具体变体:
- 中位数 (Median):。这是最常见、最推荐的 Brown-Forsythe 版本,尤其适合偏态数据。使用中位数的版本有时直接被称为 Brown-Forsythe 检验,以区别于使用均值的原始 Levene 检验。
- 10\% 修整均值 (10\% Trimmed Mean):剔除该组最小和最大各 10\% 的数据后,计算剩余数据的算术平均值。此版本在面对极端离群值时比中位数版本保留了更多信息,同时减少了均值的敏感性。
- 组均值 (Mean):。此时就退化为了原始的 Levene 检验。
第二步:对绝对离差执行单因素方差分析
将第一步得到的绝对离差 作为新的被解释变量,原始的分组变量作为解释变量,进行一项标准的单因素方差分析。换言之,检验各组之间 的均值是否存在显著差异。
具体而言,计算以下统计量:
其中:
- 是第 组绝对离差的样本均值。
- 是所有绝对离差的总均值。
这个 统计量的构造逻辑是:分子衡量各组离差均值之间的变异性(组间变异),分母衡量组内离差的变异性(组内变异)。如果各组方差确实相等,那么各组绝对离差的组间差异应该很小, 值接近于 1;如果某些组的方差显著大于其他组,其绝对离差也会更大,分子与分母的比值会增大。
第三步:做出统计推断
在零假设为真且数据满足一定条件时,上述 统计量近似服从F分布,其分子自由度 ,分母自由度 。
计算与 值对应的 p值,并与预设的显著性水平 (通常取 0.05)进行比较:
- 若 ,拒绝 ,认为至少有两组的方差存在显著差异。
- 若 ,无法拒绝 ,没有充分证据表明方差存在差异。
与相关检验的比较
Brown-Forsythe 检验位于一系列方差齐性检验的谱系之中,理解它们之间的差异有助于在具体研究中选择合适的方法。
- Bartlett 检验:核心计算为各组方差的对数加权平均;对正态性敏感度极高;对离群值稳健性低;正态下检验效能最高;适用于数据严格正态。
- Levene 检验:核心计算为基于组均值的绝对离差;对正态性敏感度中等;对离群值稳健性中等;正态下检验效能高;适用于数据略显偏态或厚尾。
- Brown-Forsythe 检验:核心计算为基于中位数/修整均值的绝对离差;对正态性敏感度低(非常稳健);对离群值稳健性高;正态下检验效能略低于 Levene 但仍良好;适用于数据明显偏态、存在离群值。
一般推荐原则:除非有充分把握认为数据来自正态总体(此时 Bartlett 检验效能最优),否则 Brown-Forsythe 检验(使用中位数)是实际应用中最安全、最常用的选择。Brown-Forsythe 检验也可以被视为一种非参数检验的替代思路,因为它依赖于中位数这一稳健的位置度量,尽管其本身仍建立在 ANOVA 的框架之上。
在计量经济学与实证研究中的应用
- 异方差性诊断:在横截面回归中,研究者可对不同子样本的回归残差分组后运行 Brown-Forsythe 检验,初步筛查异方差。正式诊断仍需配合 White检验 或 Breusch-Pagan检验。
- 政策评估中的子群体比较:在分析政策对离散程度的影响时,Brown-Forsythe 检验可判断效果方差在不同群体间是否一致。
- 实验与随机对照试验:作为 ANOVA 前的预检步骤。若方差不等,应改用 Welch ANOVA 或稳健标准误方法。
注意事项与局限
- 稳健性并非绝对:检验仍依赖 分布近似,在极端重尾分布或样本量极不均衡时近似可能不够精确。
- 效能权衡:正态数据下检验效能略低于 Bartlett 检验,这是稳健性的代价,符合偏误-方差权衡的逻辑。
- 仅判断相等性:无法揭示方差的系统性变化规律。若需建模方差如何随协变量变化,应使用方差函数模型或广义最小二乘法 (GLS)。
- 多重比较:显著结果仅表明"至少有两组不等",定位具体差异需多重比较校正(如 Bonferroni)进行事后检验。小样本下不显著的结果不应被解读为"方差必然相等"。
- 替代方案:若假设被拒绝,可用 Welch校正 ANOVA、稳健标准误 回归或广义线性模型应对异方差。
小结
Brown-Forsythe 检验是对经典 Levene 检验的一个精巧且重要的改良。通过用中位数替代均值来计算绝对离差,它在保持计算简单性和直观性的同时,获得了对非正态数据和离群值更强的稳健性。这使得它在当今注重数据质量和稳健推断的实证研究文化中占据了重要的位置。无论作为 ANOVA 前的方差齐性预检,还是作为异方差初步筛查的工具,Brown-Forsythe 检验都为研究者的分析管线提供了可信赖的一环。