ARTICLE

抽样分布定理

抽样分布定理 (Sampling Distribution Theorems) 抽样分布定理(Sampling Distribution Theorems)是数理统计和统计推断的基石。在统计学中很少能直接观测总体,通常通过获取样本来推断总体性质。抽样分布指从同一总体中多次重复抽取容量为n的样本时,某个统计量如样本均值 X 或样本方差 S^2 所服从的概率分布

浏览 4 更新 2025-12-05

抽样分布定理 (Sampling Distribution Theorems)

抽样分布定理(Sampling Distribution Theorems)是数理统计统计推断的基石。在统计学中很少能直接观测总体,通常通过获取样本来推断总体性质。抽样分布指从同一总体中多次重复抽取容量为n的样本时,某个统计量样本均值 Xˉ\bar{X}样本方差 S2S^2 所服从的概率分布。狭义上的抽样分布定理通常特指在正态总体假设下关于样本均值、样本方差及其相互关系的几个关键定理,构成了t检验F检验和构建置信区间的数学基础。

正态总体下的三大核心定理

设定总体 XN(μ,σ2)X \sim N(\mu, \sigma^2),抽取容量为n的简单随机样本 X1,,XnX_1, \ldots, X_n,各 XiX_i 相互独立且与总体同分布,即 XiN(μ,σ2)X_i \sim N(\mu, \sigma^2)

定理一:样本均值的分布。样本均值 Xˉ=(1/n)Xi\bar{X} = (1/n)\sum X_i 服从正态分布,XˉN(μ,σ2/n)\bar{X} \sim N(\mu, \sigma^2/n),方差缩小为总体方差的 1/n1/n 倍。标准化后 Z=(Xˉμ)/(σ/n)N(0,1)Z = (\bar{X} - \mu)/(\sigma/\sqrt{n}) \sim N(0, 1)。当 σ2\sigma^2 已知时,该定理直接用于构造总体均值的Z检验和置信区间。当 σ2\sigma^2 未知时,由定理二和三补救。

定理二:样本方差的卡方分布(n1)S2/σ2χ2(n1)(n-1)S^2/\sigma^2 \sim \chi^2(n-1),其中 S2=(XiXˉ)2/(n1)S^2 = \sum (X_i - \bar{X})^2/(n-1)无偏估计量。该统计量服从自由度为 n1n-1卡方分布,因为在估计均值时消耗了一个自由度。

定理三:均值与方差的独立性。在正态总体下,Xˉ\bar{X}S2S^2 相互独立,这是正态分布特有的性质,一般分布下均值与方差并不独立。结合定理一和定理二,可构造t统计量 t=(Xˉμ)/(S/n)t(n1)t = (\bar{X} - \mu)/(S/\sqrt{n}) \sim t(n-1)。t分布解决了总体方差未知时样本均值的推断问题,当n增大时t分布趋近于标准正态,小样本下需用t分布替代正态近似。

统计推断中的核心地位

正态分布、卡方分布、t分布与F分布共同构成经典统计推断的四大分布家族。F分布定义为两个独立卡方变量各除以其自由度之比,即 F=(χ12/d1)/(χ22/d2)F = (\chi_1^2/d_1)/(\chi_2^2/d_2)。抽样分布定理为线性回归中的t检验和F检验、方差分析(ANOVA)和列联表分析提供了严格的概率基础。该定理将正态总体假设下的精确分布完整推导出来,使有限样本即小样本下的精确统计推断成为可能,补充了中心极限定理的渐近框架。抽样分布定理因其数学上的完备性和优雅性,为统计推断提供了最经典的理论范式。