ARTICLE

大样本近似

大样本近似 (Large Sample Approximation) 大样本近似(Large Sample Approximation),也称渐近理论,是现代统计学与计量经济学的理论基石,研究当样本容量 n 趋于无穷大时估计量和统计检验量的概率性质与分布行为。与关注任何给定样本容量下统计量精确属性的有限样本理论不同,大样本近似提供了一种在复杂模型中进行统计推

浏览 7 更新 2025-11-07

大样本近似 (Large Sample Approximation)

大样本近似(Large Sample Approximation),也称渐近理论,是现代统计学计量经济学的理论基石,研究当样本容量 nn 趋于无穷大时估计量和统计检验量的概率性质与分布行为。与关注任何给定样本容量下统计量精确属性的有限样本理论不同,大样本近似提供了一种在复杂模型中进行统计推断的强大通用方法。在许多实际应用中,特别是处理非线性模型或放宽经典假设的模型时,推导有限样本下精确抽样分布极其困难甚至不可能。渐近理论通过分析极限行为提供解决方案,其结果是"近似"的,但对足够大的样本而言精度通常足够。

两种核心收敛概念

大样本近似建立在两个核心收敛概念之上。依概率收敛描述随机变量序列收敛到常数的情形,是一致性的理论基础。若对所有 ϵ>0\epsilon > 0limnP(Wnc>ϵ)=0\lim_{n \to \infty} P(|W_n - c| > \epsilon) = 0,则 WnW_n 依概率收敛于 cc,记作 WnpcW_n \xrightarrow{p} cplim(Wn)=c\operatorname{plim}(W_n) = c。最著名的例子是大数定律(LLN),在独立同分布随机变量序列中,样本均值 Xˉn\bar{X}_n 依概率收敛于总体均值 μ\mu。大数定律是大样本理论的第一支柱,保证了随着数据增多,估计量会越来越接近真实参数。

依分布收敛描述随机变量序列的累积分布函数(CDF)趋近于某特定极限分布的CDF,是进行大样本统计推断包括假设检验和构建置信区间的理论基础,记作 ZndZZ_n \xrightarrow{d} Z。最著名的例子是中心极限定理(CLT),独立同分布随机变量的标准化样本均值 n(Xˉnμ)/σ\sqrt{n}(\bar{X}_n - \mu)/\sigma 依分布收敛于标准正态分布。CLT是大样本理论的第二支柱,确立了正态分布在大样本近似中的中心地位。

关键性质与理论工具

一致性是依概率收敛的直接应用要求,即 θ^npθ\hat{\theta}_n \xrightarrow{p} \theta,满足此性质的估计量保证随样本量增大,估计值坍缩到真实值。渐近正态性结合依分布收敛和中心极限定理,n(θ^nθ)dN(0,V)\sqrt{n}(\hat{\theta}_n - \theta) \xrightarrow{d} N(0, V),为建立置信区间和假设检验奠定了基础。

Slutsky定理是大样本近似中极为重要的工具。若 XndXX_n \xrightarrow{d} XYnpcY_n \xrightarrow{p} c,则 Xn+YndX+cX_n + Y_n \xrightarrow{d} X + cXnYndcXX_n Y_n \xrightarrow{d} cX 等。这使得我们可以用一致估计量替代渐近方差中的未知参数,例如在似然比检验中用样本信息矩阵替代期望信息矩阵,仍保持相同的渐近分布。连续映射定理指出,若 XndXX_n \xrightarrow{d} Xgg 为连续函数,则 g(Xn)dg(X)g(X_n) \xrightarrow{d} g(X),极大简化了非线性变换下统计量分布的处理。Delta方法进一步扩展了连续映射定理到可微函数,n(g(θ^n)g(θ))dN(0,[g(θ)]2V)\sqrt{n}(g(\hat{\theta}_n) - g(\theta)) \xrightarrow{d} N(0, [g'(\theta)]^2 V),用于推导非线性参数函数的渐近分布。大样本近似构成了现代计量经济学中Wald检验似然比检验拉格朗日乘数检验等三大检验统一理论的数学基础。