ARTICLE

组间均方

组间均方 (Between-Group Mean Square) 组间均方(Between-Group Mean Square,常缩写为 MSB 或 MS_ between)是方差分析(ANOVA)中衡量不同处理组或分组之间变异程度的核心统计量。其定义为组间平方和(Sum of Squares Between, SSB)除以对应的自由度 k - 1,即: 其

浏览 4 更新 2025-07-14

组间均方 (Between-Group Mean Square)

组间均方(Between-Group Mean Square,常缩写为 MSBMSBMSbetweenMS_{\text{between}})是方差分析(ANOVA)中衡量不同处理组或分组之间变异程度的核心统计量。其定义为组间平方和(Sum of Squares Between, SSBSSB)除以对应的自由度 k1k - 1,即:

MSB=SSBk1=i=1kni(YˉiYˉ)2k1MSB = \frac{SSB}{k - 1} = \frac{\sum_{i=1}^{k} n_i (\bar{Y}_{i\cdot} - \bar{Y}_{\cdot\cdot})^2}{k - 1}

其中 kk 为组数,nin_i 为第 ii 组的样本量,Yˉi\bar{Y}_{i\cdot} 为第 ii 组的样本均值,Yˉ\bar{Y}_{\cdot\cdot} 为总均值。组间均方本质上是对处理效应引起的变异的量化——当各组的总体均值确实存在差异时,组间均方将倾向于大于纯随机误差所能解释的水平。它与组内均方(Within-Group Mean Square, MSWMSW)共同构成方差分析的两大支柱,二者的比值 F=MSB/MSWF = MSB / MSW 即为检验"所有组均值相等"这一原假设的F检验统计量。

变异分解的统计逻辑

方差分析的核心在于将数据的总变异 SSTSS_T 分解为两个正交来源:组间变异 SSBSSB 和组内变异 SSWSSW(也称误差变异)。这一分解基于恒等式:

i=1kj=1ni(YijYˉ)2=i=1kni(YˉiYˉ)2+i=1kj=1ni(YijYˉi)2\sum_{i=1}^{k} \sum_{j=1}^{n_i} (Y_{ij} - \bar{Y}_{\cdot\cdot})^2 = \sum_{i=1}^{k} n_i (\bar{Y}_{i\cdot} - \bar{Y}_{\cdot\cdot})^2 + \sum_{i=1}^{k} \sum_{j=1}^{n_i} (Y_{ij} - \bar{Y}_{i\cdot})^2

对应的自由度满足可加性:N1=(k1)+(Nk)N - 1 = (k - 1) + (N - k),其中 N=niN = \sum n_i。在原假设(各组均值相等)下,MSBMSBMSWMSW 均为总体方差 σ2\sigma^2 的无偏估计,因此 FF 值围绕1波动;当备择假设成立时,MSBMSB 的期望值额外包含一个由处理效应差异产生的正项,使 FF 值显著大于1。这一构造是罗纳德·费希尔建立方差分析理论时的核心洞见。

期望均方与检验功效

在单因素固定效应模型 Yij=μ+τi+ϵij,  ϵijN(0,σ2)Y_{ij} = \mu + \tau_i + \epsilon_{ij}, \; \epsilon_{ij} \sim N(0, \sigma^2) 下,两个均方的期望值分别为:

E(MSB)=σ2+i=1kniτi2k1,E(MSW)=σ2E(MSB) = \sigma^2 + \frac{\sum_{i=1}^{k} n_i \tau_i^2}{k - 1}, \quad E(MSW) = \sigma^2

当且仅当所有处理效应 τi=0\tau_i = 0 时,二者期望相等。存在非零效应时,E(MSB)>E(MSW)E(MSB) > E(MSW),差异取决于样本量和效应大小的乘积——这正是检验功效(Statistical Power)的数学基础。在备择假设下,FF 统计量服从非中心F分布,其非中心参数 λ=niτi2/σ2\lambda = \sum n_i \tau_i^2 / \sigma^2 直接决定了检验区分原假设与备择假设的能力。

效应量与多重比较

F检验显著后,研究者需借助效应量(Effect Size)衡量实际意义。最常用的 η2\eta^2(Eta-squared)定义为:

η2=SSBSST=SSBSSB+SSW\eta^2 = \frac{SSB}{SST} = \frac{SSB}{SSB + SSW}

它表示分组因素可解释的变异比例,值域 [0,1][0, 1]。另一常用指标 Cohen's f=η2/(1η2)f = \sqrt{\eta^2 / (1 - \eta^2)},对应小(0.10)、中(0.25)、大(0.40)的经验阈值。

F检验拒绝原假设后,需通过多重比较(Multiple Comparison)定位具体差异来源:Tukey的HSD法、Bonferroni校正以及Scheffé方法均为常用策略。这些方法在控制族系误差率(FWER)或错误发现率(FDR)的前提下进行成对检验,而组间均方是构建所有检验统计量和置信区间的共同输入。若方差齐性假设不成立,可转向Welch ANOVA或Kruskal-Wallis检验等替代方法。

经济学与社会科学中的延伸

组间均方的分解逻辑已渗透至多个经济学领域。在计量经济学中,面板数据固定效应模型通过"组内去均值"消除不随时间变化的异质性——这在数学上等价于剥离组间变异、仅在组内维度进行识别。在收入不平等研究中,广义熵指数可按组间和组内分解,组间均方所捕捉的正是地区、教育水平或行业等分组因素对总体不平等的贡献份额。在政策评估随机对照试验中,组间均方通过F检验为判断干预的因果效应提供基础推断工具。

需注意,组间均方对异常值和方差齐性偏离较为敏感:异方差或非正态时,标准F检验可能产生膨胀的I类错误率,此时应转向基于Bootstrap的方差分析或贝叶斯分层模型。对于聚类或层级数据,传统框架已被推广至混合效应模型和多层线性模型(HLM)。