ARTICLE

依概率收敛

依概率收敛 (Convergence in Probability) 依概率收敛(弱收敛)描述随机变量序列当 n 时的行为,是大数定律的数学基础和评价统计估计量一致性的核心概念。 定义 随机变量序列 \X_n\ 依概率收敛于随机变量 X(记为 X_n p X 或 plim\, X_n = X),若对任意 > 0: 含义:X_n 与 X 偏差超过任意小容限 的

浏览 102 更新 2025-10-23

依概率收敛 (Convergence in Probability)

依概率收敛(弱收敛)描述随机变量序列当 nn\to\infty 时的行为,是大数定律的数学基础和评价统计估计量一致性的核心概念。

定义

随机变量序列 {Xn}\{X_n\} 依概率收敛于随机变量 XX(记为 XnpXX_n \xrightarrow{p} XplimXn=X\mathrm{plim}\, X_n = X),若对任意 ϵ>0\epsilon > 0

limnP(XnX>ϵ)=0\lim_{n\to\infty} P(|X_n - X| > \epsilon) = 0

含义:XnX_nXX 偏差超过任意小容限 ϵ\epsilon 的概率随 nn 增大趋于零。目标常数为常数 cc(如总体参数):plimXn=c\mathrm{plim}\, X_n = c

直观理解

样本均值估计总体均值为例:Xˉn\bar{X}_nnn↑与真实 μ\mu 之间大偏差可能性越来越小。设定任意 ϵ\epsilon(如0.1cm),nn 足够大→P(Xˉnμ>ϵ)0P(|\bar{X}_n-\mu|>\epsilon)\approx 0。这正是弱大数定律(WLLN)——若i.i.d.且 E[Xi]=μE[X_i]=\mu 存在→Xˉnpμ\bar{X}_n \xrightarrow{p} \mu

与其他收敛形式的关系

殆必收敛(a.s.)P(limXn=X)=1P(\lim X_n = X)=1,更强(a.s.→p)。a.s.保证几乎所有样本路径最终收敛到X;p只保证远离X概率趋于零。

依分布收敛(d):CDF逐点收敛,p更强(p→d)。p关涉取值;d仅关涉分布形状。特例:XndcX_n \xrightarrow{d} cXnpcX_n \xrightarrow{p} c

均方收敛(L2L^2)limE[(XnX)2]=0\lim E[(X_n-X)^2]=0,更强(L2L^2→p,可用切比雪夫不等式证明)。

收敛强弱层级: a.s.→p→d;L2L^2→p。

应用

一致估计量θ^npθ\hat{\theta}_n \xrightarrow{p} \theta(样本量大→估计越来越接近真参数,基本统计素养要求)。弱大数定律:依概率收敛最经典范例。连续映射定理:若 XnpXX_n \xrightarrow{p} Xgg 连续→g(Xn)pg(X)g(X_n) \xrightarrow{p} g(X)。例:Xˉnpμ\bar{X}_n \xrightarrow{p} \mu(且μ0\mu\neq0)→1/Xˉnp1/μ1/\bar{X}_n \xrightarrow{p} 1/\mu

证明示例(切比雪夫证WLLN)

I.i.d. XiX_iE[Xi]=μE[X_i]=\muVar(Xi)=σ2<Var(X_i)=\sigma^2<\inftyXˉn\bar{X}_n 期望μ\mu,方差σ2/n\sigma^2/n切比雪夫不等式P(Xˉnμϵ)σ2/(nϵ2)P(|\bar{X}_n-\mu|\ge\epsilon) \le \sigma^2/(n\epsilon^2)。取 nn\to\infty→右端→0,夹逼定理:limP(Xˉnμ>ϵ)=0\lim P(|\bar{X}_n-\mu|>\epsilon)=0。证毕。