ARTICLE

大样本正态近似

大样本正态近似 (Large-Sample Normal Approximation) 大样本正态近似是数理统计与计量经济学中最常用的近似思想之一:当样本量n足够大时,许多由样本构造的随机量(样本均值、样本比例、各类估计量与检验统计量)在适当标准化后其分布可用正态分布来近似——从而便于构造置信区间、进行假设检验与近似计算尾部概率。理论核心来自中心极限定理与更

浏览 3 更新 2026-01-05

大样本正态近似 (Large-Sample Normal Approximation)

大样本正态近似是数理统计计量经济学中最常用的近似思想之一:当样本量nn足够大时,许多由样本构造的随机量(样本均值样本比例、各类估计量与检验统计量)在适当标准化后其分布可用正态分布来近似——从而便于构造置信区间、进行假设检验与近似计算尾部概率。理论核心来自中心极限定理与更一般的渐近正态性结论,实践中常通过"估计量约为正态"推导近似标准误和临界值(如zα/2z_{\alpha/2})。

基本思想与数学表述

从中心极限定理到正态近似:设X1,,XnX_1,\ldots,X_n为独立同分布随机变量,E(Xi)=μE(X_i)=\muVar(Xi)=σ2<\operatorname{Var}(X_i)=\sigma^2<\infty。令Sn=XiS_n=\sum X_iXˉ=Sn/n\bar{X}=S_n/n。在适当条件下:

Xˉμσ/ndN(0,1)\frac{\bar{X}-\mu}{\sigma/\sqrt{n}} \xrightarrow{d} N(0,1)

由此得到大样本近似规则:XˉN(μ,σ2/n)\bar{X} \approx N(\mu, \sigma^2/n)SnN(nμ,nσ2)S_n \approx N(n\mu, n\sigma^2)。更一般地,对估计量θ^\hat{\theta}若存在V>0V>0使n(θ^θ0)dN(0,V)\sqrt{n}(\hat{\theta}-\theta_0) \xrightarrow{d} N(0,V)——则称θ^\hat{\theta}对参数θ0\theta_0具有渐近正态性——可写作θ^N(θ0,V/n)\hat{\theta} \approx N(\theta_0, V/n)。该近似构成了大样本下置信区间和假设检验的理论基础。

样本比例的经典特例:设p^=X/n\hat{p}=X/n为从伯努利试验中获得的样本比例——XBinomial(n,p)X \sim \operatorname{Binomial}(n,p)。当n大时(经验规则np5np \ge 5n(1p)5n(1-p) \ge 5):

p^N(p,p(1p)n)\hat{p} \approx N\left(p, \frac{p(1-p)}{n}\right)

由此可得比例的置信区间p^±zα/2p^(1p^)/n\hat{p} \pm z_{\alpha/2}\sqrt{\hat{p}(1-\hat{p})/n}

实践中的关键注意事项

需注意的关键限制。近似精度取决于样本量和分布形态n30n \ge 30是经验法则但严重偏态或厚尾分布需更大样本。连续性校正:对离散分布(二项、泊松)用连续正态近似时可进行连续性校正提高近似精度。方差估计问题:实际中σ2\sigma^2通常未知——用样本方差s2s^2替代——当n大时Xˉ/(s/n)\bar{X}/(s/\sqrt{n})近似于标准正态——此即大样本z检验的基础(区别于小样本t检验)。

大样本正态近似在计量经济学(OLS估计量的渐近分布)、最大似然估计的渐近正态性和广义矩估计(GMM)的推导等各领域普遍使用。在机器学习交叉验证Bootstrap中,重抽样统计量的正态近似简化了置信区间的计算。大样本正态近似是连接数理统计理论与实证应用的核心桥梁——以简洁近似替代复杂精确分布——其运用在许多现代统计实践中不可或缺。