ARTICLE

两独立样本均值差异的检验

两独立样本均值差异的检验 (Test for the Difference between Two Independent Sample Means) 两独立样本均值差异的检验,通常称为两样本t检验 (Two-Sample t-test),是一种在统计推断中被广泛使用的假设检验方法。其核心目标是,基于从两个独立的总体中分别抽取的两个样本,来判断这两个总体的均

浏览 16 更新 2025-10-25

两独立样本均值差异的检验 (Test for the Difference between Two Independent Sample Means)

两独立样本均值差异的检验,通常称为两样本t检验 (Two-Sample t-test),是一种在统计推断中被广泛使用的假设检验方法。其核心目标是,基于从两个独立的总体中分别抽取的两个样本,来判断这两个总体的均值是否存在显著差异。例如,比较两种教学方法下学生的平均考试成绩,或比较新药与安慰剂对病患生理指标的影响。该检验是计量经济学、生物统计学和社会科学等领域进行实验数据分析的基础工具。

检验逻辑与基本假设

假设有两个独立总体,均值分别为 μ1\mu_1μ2\mu_2,从中分别抽取样本得到 xˉ1\bar{x}_1xˉ2\bar{x}_2。由于抽样误差的存在,即使 μ1=μ2\mu_1 = \mu_2,样本均值也几乎不可能完全相等。因此核心问题是:观测到的样本均值之差 (xˉ1xˉ2)(\bar{x}_1 - \bar{x}_2) 在多大程度上由抽样变异引起,又在多大程度上反映真实差异? 两样本t检验通过构建标准化检验统计量来回答。

进行检验前须满足三个关键假设:

  • 独立性 (Independence):两个样本相互独立,样本内部观测值亦独立。随机分组可确保独立性。
  • 正态性 (Normality):两总体服从正态分布。根据中心极限定理,当两样本容量足够大时(通常 n130n_1 \ge 30n230n_2 \ge 30),可放宽此要求。
  • 方差齐性或非齐性方差齐性假设两总体方差相等 σ12=σ22\sigma_1^2 = \sigma_2^2方差非齐性则不假设相等。这一区分决定使用何种t检验形式。

检验统计量计算

合并t检验(方差齐性)

当有理由相信两总体方差相等时,使用合并t检验 (Pooled t-test)。先计算合并样本方差:

sp2=(n11)s12+(n21)s22n1+n22s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}

其中 s12,s22s_1^2, s_2^2 为样本方差,n1,n2n_1, n_2 为样本容量。检验统计量为:

t=(xˉ1xˉ2)D0sp2(1n1+1n2)t = \frac{(\bar{x}_1 - \bar{x}_2) - D_0}{\sqrt{s_p^2 \left( \frac{1}{n_1} + \frac{1}{n_2} \right)}}

D0D_0 为原假设中假设的均值差(通常 D0=0D_0 = 0),该统计量服从自由度为 df=n1+n22df = n_1 + n_2 - 2t分布

韦尔奇t检验(方差非齐性)

在大多数实际应用中推荐使用韦尔奇t检验 (Welch's t-test),它不要求方差齐性,更稳健。统计量为:

t=(xˉ1xˉ2)D0s12n1+s22n2t = \frac{(\bar{x}_1 - \bar{x}_2) - D_0}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}}

自由度采用韦尔奇-萨特思韦特方程近似:

df(s12n1+s22n2)2(s12/n1)2n11+(s22/n2)2n21df \approx \frac{\left(\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}\right)^2}{\frac{(s_1^2/n_1)^2}{n_1-1} + \frac{(s_2^2/n_2)^2}{n_2-1}}

统计决策与置信区间

假设设立

原假设 H0H_0 通常为总体均值无差异,备择假设 HaH_a 为存在差异:

  • 双尾检验H0:μ1=μ2H_0: \mu_1 = \mu_2 vs Ha:μ1μ2H_a: \mu_1 \neq \mu_2
  • 右尾检验H0:μ1μ2H_0: \mu_1 \le \mu_2 vs Ha:μ1>μ2H_a: \mu_1 > \mu_2
  • 左尾检验H0:μ1μ2H_0: \mu_1 \ge \mu_2 vs Ha:μ1<μ2H_a: \mu_1 < \mu_2

决策方法

临界值法:设定显著性水平 α\alpha(如0.05),根据 α\alpha 和自由度查临界值 tcriticalt_{\text{critical}}。若 t>tcritical|t| > t_{\text{critical}},拒绝 H0H_0

p值法:计算与统计量t对应的p值。p值是在 H0H_0 为真时获得当前或更极端统计量的概率。若 p<αp < \alpha,拒绝 H0H_0

若拒绝 H0H_0,则有足够统计证据表明两总体均值存在显著差异;若未拒绝,则证据不足。

均值差异的置信区间

μ1μ2\mu_1 - \mu_2 构建置信区间

(xˉ1xˉ2)±tα/2,df×标准误(\bar{x}_1 - \bar{x}_2) \pm t_{\alpha/2, df} \times \text{标准误}

合并t检验的标准误为 sp2(1/n1+1/n2)\sqrt{s_p^2(1/n_1 + 1/n_2)},自由度为 n1+n22n_1+n_2-2;Welch检验的标准误为 s12/n1+s22/n2\sqrt{s_1^2/n_1 + s_2^2/n_2}。若置信区间包含0,则与未拒绝 H0H_0 一致;若不包含0,则与拒绝 H0H_0 一致。

与其他检验的关系

两独立样本t检验与Z检验的区别在于,Z检验要求两总体方差已知,这在实践中较少见,故t检验更常用。与方差分析(ANOVA)的关系上,两独立样本t检验可视为方差分析在比较两个组别时的特例。当需比较三个或更多组别均值时须使用ANOVA。该检验依赖独立同分布条件,违反独立性假设时应采用配对t检验或其他相关样本方法。