ARTICLE

合并方差

合并方差 (Pooled Variance) 合并方差(Pooled Variance),记为 s_p^2,是在统计学中当假定多个总体具有相同的方差时用于估计该共同方差的一种方法。通过整合即合并来自多个独立样本的变异信息,提供比任何单个样本方差更精确和稳健的方差估计值。合并方差最常见的应用是独立样本t检验和方差分析(ANOVA)。 计算方法 合并方差的根本思

浏览 9 更新 2025-11-03

合并方差 (Pooled Variance)

合并方差(Pooled Variance),记为 sp2s_p^2,是在统计学中当假定多个总体具有相同的方差时用于估计该共同方差的一种方法。通过整合即合并来自多个独立样本的变异信息,提供比任何单个样本方差更精确和稳健的方差估计值。合并方差最常见的应用是独立样本t检验方差分析(ANOVA)。

计算方法

合并方差的根本思想为,若多个样本来源于方差相同的不同总体(满足方差齐性假设),将这些方差信息结合可得基于更大信息量的对共同总体方差 σ2\sigma^2 的更优估计。合并过程本质是加权平均,每个样本的方差以该样本的自由度为权,来自更大样本的数据提供更可靠信息应被赋予更高权重。

两样本情况:sp2=((n11)s12+(n21)s22)/(n1+n22)s_p^2 = ((n_1-1)s_1^2 + (n_2-1)s_2^2)/(n_1 + n_2 - 2),其中 n1,n2n_1, n_2 为样本量,s12,s22s_1^2, s_2^2样本方差(除数为 n1n-1),分母 n1+n22n_1 + n_2 - 2 为合并自由度。k个样本推广:sp2=(ni1)si2/(ni1)s_p^2 = \sum (n_i-1)s_i^2 / \sum (n_i-1)。在ANOVA语境中称为组内均方(MSW)或均方误差(MSE),代表数据中随机误差引起的变异部分,是F检验统计量的分母。

方差齐性前提与应用

使用合并方差的最关键前提是方差齐性(Homogeneity of Variances),即 σ12=σ22==σk2\sigma_1^2 = \sigma_2^2 = \cdots = \sigma_k^2。检验方差齐性的常用方法包括:Levene检验,稳健性较好,对数据是否正态分布不敏感,最常用;Bartlett检验,要求数据近似正态,对非正态数据较敏感;F检验(两总体方差相等性检验),仅适用于两个总体且对正态要求极严。若检验结果表明方差不相等,则不应使用合并方差而应采用不假定方差相等的替代方法,如Welch's t检验或Welch ANOVA。

在独立样本t检验中,合并方差用于计算标准误:t=(xˉ1xˉ2)/sp2(1/n1+1/n2)t = (\bar{x}_1 - \bar{x}_2)/\sqrt{s_p^2(1/n_1 + 1/n_2)},自由度为 n1+n22n_1 + n_2 - 2。合并方差通过利用两样本的共同方差信息提供了对标准误的更精确估计,从而提升检验统计功效,但代价是依赖方差齐性假设,当该假设不满足时合并方差估计不具一致性和效率改进。合并方差体现了统计推断中信息融合的基本原则:在合理假设前提下将分散的样本信息合并为单一高精度估计。这一思想在元分析分层模型的方差成分估计中得到了更广泛的应用。