两独立样本均值差异的假设检验
核心目标:利用两独立样本判断其对应总体均值是否存在统计显著性差异。非关注样本均值差xˉ1−xˉ2本身→而是推断未知总体均值差μ1−μ2。
前提条件与假设
独立样本:一个样本个体选择不影响另一个(vs配对样本中同一个体两次测量)。正态性:两总体正态→但中心极限定理→n1,n2>30时样本均值抽样分布近正态(总体非正态也可放宽)。小样本需正态性检验(Shapiro-Wilk)/Q-Q图评估。方差假设:
- 已知→理论上Z检验→Z=((xˉ1−xˉ2)−(μ1−μ2)0)/σ12/n1+σ22/n2。
- 未知:方差相等→合并t检验(Pooled):sp2=((n1−1)s12+(n2−1)s22)/(n1+n2−2)→t=(xˉ1−xˉ2)/sp2(1/n1+1/n2),df=n1+n2−2。
- 未知:方差不相等→Welch's t-test(现代默认→稳健→即使方差相等表现也近合并):t=(xˉ1−xˉ2)/s12/n1+s22/n2。自由度用Welch-Satterthwaite公式:df≈(s12/n1+s22/n2)2/n1−1(s12/n1)2+n2−1(s22/n2)2。
检验五步骤
1设立H0:μ1=μ2,H1三形:双侧μ1=μ2/右侧μ1>μ2/左侧μ1<μ2。2设显著性水平α(通常0.05/0.01)。3计算t(上)。4决策:p值法→若p≤α则拒H0(现代最常用);临界值法→统计量绝对值>临界值即落拒绝域。5解释→拒绝→有证据表两总体均值显著差异;未拒绝→证据不足表差异(≠证明两均值相等)。
置信区间与效应量
μ1−μ2的1−αCI:Welch下(xˉ1−xˉ2)±tα/2,dfs12/n1+s22/n2。双侧检验→CI不包含0→拒H0(CI含更多信息>仅p值)。
效应量(Cohen's d):p值仅表差异是否统计显著→效应量度量差异大小实践意义(均值差除以合并标准差→标准化→独立于样本量)。统计功效:H1真时正确拒H0的概率→功效分析确定所需样本量(通常目标80\%)。Levene检验判断方差齐性。