两样本假设检验方法的汇总
两样本假设检验利用两个总体的样本数据,对总体参数(均值、方差、比例)之间的关系进行统计推断。
共同框架:原假设 H0(无差异)vs 备择假设 H1(存在差异,可双侧或单侧),计算检验统计量,基于p-value和显著性水平 α 做决策。
选择方法的关键维度:检验目标、样本关系(独立/配对)、总体分布假设(参数检验 vs 非参数检验)。
比较总体均值
独立样本t检验
假设两总体正态分布。方差相等时使用合并样本方差:
Sp2=n1+n2−2(n1−1)s12+(n2−1)s22,t=Sp1/n1+1/n2(xˉ1−xˉ2), df=n1+n2−2
方差不相等时使用Welch's t-test(更稳健推荐):
t=s12/n1+s22/n2xˉ1−xˉ2
自由度由Welch-Satterthwaite公式近似。
配对样本t检验
化为单样本t检验:计算差值 di=xi,1−xi,2,检验 H0:μd=0:
t=sd/ndˉ, df=n−1
Z检验
两总体方差已知(理论重要但实践少用):Z=(xˉ1−xˉ2)/σ12/n1+σ22/n2∼N(0,1)
比较均值/中位数的非参数方法
比较总体方差
- F检验:F=s12/s22∼F(n1−1,n2−1),对正态性假设非常敏感
- Levene检验:对偏离正态更稳健,基于组内观测值与组均值之差的绝对值进行方差分析
比较总体比例
两样本比例Z检验:合并比例 p^=(x1+x2)/(n1+n2)
Z=p^(1−p^)(1/n1+1/n2)p^1−p^2∼N(0,1)
卡方检验:对于 2×2 列联表等价于两样本比例Z检验:
χ2=∑期望(观测−期望)2, df=(r−1)(c−1)
决策流程与总结
\begin{tabular}{|l|l|l|l|l|} \hline 目标 \& 样本关系 \& 假设 \& 参数方法 \& 非参数替代 \\ \hline 均值 \& 独立 \& 正态, 方差齐性 \& 独立样本t检验 \& 曼-惠特尼U检验 \\ \hline 均值 \& 配对 \& 差值正态 \& 配对样本t检验 \& 威尔科克森符号秩检验 \\ \hline 方差 \& 独立 \& 正态 \& F检验 \& Levene检验(更稳健) \\ \hline 比例 \& 独立 \& 大样本 \& 两样本比例Z / 卡方检验 \& Fisher精确检验 \\ \hline \end{tabular}