ARTICLE

两样本假设检验方法的汇总

两样本假设检验方法的汇总 两样本假设检验利用两个总体的样本数据,对总体参数(均值、方差、比例)之间的关系进行统计推断。 共同框架:原假设 H_0(无差异)vs 备择假设 H_1(存在差异,可双侧或单侧),计算检验统计量,基于p-value和显著性水平 做决策。 选择方法的关键维度:检验目标、样本关系(独立/配对)、总体分布假设(参数检验 vs 非参数检验)。

浏览 19 更新 2025-10-25

两样本假设检验方法的汇总

两样本假设检验利用两个总体样本数据,对总体参数均值方差比例)之间的关系进行统计推断。

共同框架原假设 H0H_0(无差异)vs 备择假设 H1H_1(存在差异,可双侧或单侧),计算检验统计量,基于p-value显著性水平 α\alpha 做决策。

选择方法的关键维度:检验目标、样本关系(独立/配对)、总体分布假设(参数检验 vs 非参数检验)。

比较总体均值

独立样本t检验

假设两总体正态分布。方差相等时使用合并样本方差:

Sp2=(n11)s12+(n21)s22n1+n22,t=(xˉ1xˉ2)Sp1/n1+1/n2, df=n1+n22S_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}, \quad t = \frac{(\bar{x}_1 - \bar{x}_2)}{S_p \sqrt{1/n_1 + 1/n_2}},\ df = n_1+n_2-2

方差不相等时使用Welch's t-test(更稳健推荐):

t=xˉ1xˉ2s12/n1+s22/n2t = \frac{\bar{x}_1 - \bar{x}_2}{\sqrt{s_1^2/n_1 + s_2^2/n_2}}

自由度由Welch-Satterthwaite公式近似。

配对样本t检验

化为单样本t检验:计算差值 di=xi,1xi,2d_i = x_{i,1} - x_{i,2},检验 H0:μd=0H_0: \mu_d = 0

t=dˉsd/n, df=n1t = \frac{\bar{d}}{s_d / \sqrt{n}},\ df = n-1

Z检验

两总体方差已知(理论重要但实践少用):Z=(xˉ1xˉ2)/σ12/n1+σ22/n2N(0,1)Z = (\bar{x}_1 - \bar{x}_2) / \sqrt{\sigma_1^2/n_1 + \sigma_2^2/n_2} \sim N(0,1)

比较均值/中位数的非参数方法

比较总体方差

  • F检验F=s12/s22F(n11,n21)F = s_1^2 / s_2^2 \sim F(n_1-1, n_2-1),对正态性假设非常敏感
  • Levene检验:对偏离正态更稳健,基于组内观测值与组均值之差的绝对值进行方差分析

比较总体比例

两样本比例Z检验:合并比例 p^=(x1+x2)/(n1+n2)\hat{p} = (x_1+x_2)/(n_1+n_2)

Z=p^1p^2p^(1p^)(1/n1+1/n2)N(0,1)Z = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{\hat{p}(1-\hat{p})(1/n_1 + 1/n_2)}} \sim N(0,1)

卡方检验:对于 2×22 \times 2 列联表等价于两样本比例Z检验:

χ2=(观测期望)2期望, df=(r1)(c1)\chi^2 = \sum \frac{(\text{观测} - \text{期望})^2}{\text{期望}},\ df = (r-1)(c-1)

决策流程与总结

\begin{tabular}{|l|l|l|l|l|} \hline 目标 \& 样本关系 \& 假设 \& 参数方法 \& 非参数替代 \\ \hline 均值 \& 独立 \& 正态, 方差齐性 \& 独立样本t检验 \& 曼-惠特尼U检验 \\ \hline 均值 \& 配对 \& 差值正态 \& 配对样本t检验 \& 威尔科克森符号秩检验 \\ \hline 方差 \& 独立 \& 正态 \& F检验 \& Levene检验(更稳健) \\ \hline 比例 \& 独立 \& 大样本 \& 两样本比例Z / 卡方检验 \& Fisher精确检验 \\ \hline \end{tabular}