依概率收敛 (Convergence in Probability)
依概率收敛(弱收敛)描述随机变量序列当 n→∞ 时的行为,是大数定律的数学基础和评价统计估计量一致性的核心概念。
定义
随机变量序列 {Xn} 依概率收敛于随机变量 X(记为 XnpX 或 plimXn=X),若对任意 ϵ>0:
n→∞limP(∣Xn−X∣>ϵ)=0
含义:Xn 与 X 偏差超过任意小容限 ϵ 的概率随 n 增大趋于零。目标常数为常数 c(如总体参数):plimXn=c。
直观理解
样本均值估计总体均值为例:Xˉn 随 n↑与真实 μ 之间大偏差可能性越来越小。设定任意 ϵ(如0.1cm),n 足够大→P(∣Xˉn−μ∣>ϵ)≈0。这正是弱大数定律(WLLN)——若i.i.d.且 E[Xi]=μ 存在→Xˉnpμ。
与其他收敛形式的关系
殆必收敛(a.s.):P(limXn=X)=1,更强(a.s.→p)。a.s.保证几乎所有样本路径最终收敛到X;p只保证远离X概率趋于零。
依分布收敛(d):CDF逐点收敛,p更强(p→d)。p关涉取值;d仅关涉分布形状。特例:Xndc → Xnpc。
均方收敛(L2):limE[(Xn−X)2]=0,更强(L2→p,可用切比雪夫不等式证明)。
收敛强弱层级: a.s.→p→d;L2→p。
应用
一致估计量:θ^npθ(样本量大→估计越来越接近真参数,基本统计素养要求)。弱大数定律:依概率收敛最经典范例。连续映射定理:若 XnpX 且 g 连续→g(Xn)pg(X)。例:Xˉnpμ(且μ=0)→1/Xˉnp1/μ。
证明示例(切比雪夫证WLLN)
I.i.d. Xi,E[Xi]=μ,Var(Xi)=σ2<∞。Xˉn 期望μ,方差σ2/n。切比雪夫不等式:P(∣Xˉn−μ∣≥ϵ)≤σ2/(nϵ2)。取 n→∞→右端→0,夹逼定理:limP(∣Xˉn−μ∣>ϵ)=0。证毕。