弱收敛 (Weak Convergence)
弱收敛 (Weak Convergence) 是 概率论 与 测度论 中的核心收敛概念,描述一列概率测度(或随机变量)在分布意义上的极限行为。在概率论中,弱收敛与 依分布收敛 (Convergence in Distribution) 等价,是四种经典随机收敛模式中要求最弱的一种。其理论基石由 Alexandroff、Kolmogorov、Prokhorov 等数学家在 20 世纪中叶奠定,现已成为 计量经济学、统计学 中渐近理论 (Asymptotic Theory) 的基本语言。
定义
设 S 是一个可度量空间,配备 Borel σ-代数 B(S)。设 {Pn}n=1∞ 和 P 是 (S,B(S)) 上的概率测度。称 Pn 弱收敛 于 P,记作 PnwP,若对任意有界连续实值函数 f∈Cb(S),有:
∫SfdPn⟶∫SfdP,n→∞.
对随机变量而言:设 {Xn}n=1∞ 和 X 是取值于 S 的随机元,分别定义在不必相同的概率空间上,分布为 Pn=P∘Xn−1、P=P∘X−1。称 Xn 依分布收敛 于 X,记作 XndX,当且仅当其分布的弱收敛 PnwP 成立。
特别地,当 S=R 时,用分布函数 (CDF) 判定更为直观:设 Fn(x)=P(Xn≤x),F(x)=P(X≤x),则 XndX 当且仅当在 F 的每个连续点 x 处有:
n→∞limFn(x)=F(x).
Portmanteau 定理(等价刻画)
弱收敛具有多个等价刻画,统称为 Portmanteau 定理 (Portmanteau Theorem)。以下命题等价:
- PnwP。
- 对任意开集 G⊂S,liminfnPn(G)≥P(G)。
- 对任意闭集 F⊂S,limsupnPn(F)≤P(F)。
- 对任意满足 P(∂A)=0 的 Borel 集 A(即 A 是 P-连续集),limnPn(A)=P(A)。
- 对任意有界 Lipschitz 函数 f,∫fdPn→∫fdP。
其中条件 (4) 在 渐近理论 中尤为实用:通过选取合适的 P-连续集 A,可避免在边界上发生概率堆积的复杂情形。条件 (5) 则将检验函数从 Cb(S) 缩减为 Lipschitz 族,在实际验证中提供便利。
特征函数与 Lévy 连续性定理
在 S=Rk 时,弱收敛可通过 特征函数 (Characteristic Function) 得到优雅刻画。记 φn(t)=E[eit′Xn],φ(t)=E[eit′X]。
Lévy 连续性定理 (Lévy Continuity Theorem):XndX 当且仅当对每个 t∈Rk,φn(t)→φ(t)(逐点收敛)。更进一步,若 φn(t) 逐点收敛到某个在原点连续的函数 φ(t),则 φ 必为某随机向量 X 的特征函数,且 XndX。
该定理是证明 中心极限定理 (Central Limit Theorem) 的标准工具:将标准化部分和的分布弱收敛问题转化为其特征函数在 t=0 附近的 Taylor 展开分析。
连续映射定理与 Slutsky 定理
弱收敛的两个核心运算法则是渐近推断的基础:
连续映射定理 (Continuous Mapping Theorem, CMT):若 XndX 且 g:S→T 在 PX 的支撑上几乎处处连续,则 g(Xn)dg(X)。该结果使 Delta方法 等工具成为可能——将复杂统计量的分布收敛问题转化为对简单统计量施加连续变换。
Slutsky 定理:若 XndX 且 Ynpc(依概率收敛到常数 c),则:
Xn+YndX+c,XnYndcX,YnXndcX(c=0).
这一结果在计量经济学中至关重要:当用一致估计量替代未知参数(如用 s2 替代 σ2)时,Slutsky 定理保证统计量的渐近分布不受影响,从而支持 Wald检验 和 t检验 的大样本有效性。
与其他收敛模式的关系
设 Xn 和 X 定义在同一概率空间上,四种经典收敛模式的关系为:
几乎必然收敛 (a.s.)⟹依概率收敛 (p)⟹依分布收敛/弱收敛 (d),
Lp收敛⟹依概率收敛⟹弱收敛.
弱收敛是其中最弱的要求——它不要求随机变量定义在相同概率空间,也不关心逐点行为,仅关注分布层面的逼近。因此,弱收敛是渐近统计中唯一"默认可用"的收敛模式:当更强的收敛无法证明时,弱收敛往往是留下的最后防线。
一个关键反例:XndX 不能 推出 Xn−Xd0;事实上 Xn 和 X 甚至可以相互独立。这意味着弱收敛不传递差分信息,在构造置信区间时需借助 Slutsky 定理或更为精细的 Bootstrap 方法加以补救。
计量经济学中的应用
弱收敛是现代 计量经济学 渐近理论的底层语言:
- 极大似然估计 (MLE):在一定正则条件下,n(θ^n−θ0)dN(0,I(θ0)−1),其中 I(θ0) 是 Fisher 信息矩阵。该结论的严格证明依赖于弱收敛框架下的 Cramér-Rao下界 讨论和 Taylor 展开。
- GMM 估计:Hansen 的 广义矩估计 (GMM) 中,矩条件的样本平均依中心极限定理弱收敛于正态分布,进而通过 Delta 方法传递到参数估计量。
- 单位根与协整:在 单位根检验 (Dickey-Fuller) 中,检验统计量弱收敛于布朗运动的泛函而非正态分布,这一"非标准分布"现象深刻改变了推断程序。
紧致性与 Prokhorov 定理
弱收敛理论中,Prokhorov 定理 提供了紧致性判据:一族概率测度 P 是 胎紧的 (Tight) 当且仅当其在弱拓扑下是相对紧的——即任意序列均存在弱收敛子列。该结果在证明估计量存在渐近分布(即"紧致→子列收敛→识别极限唯一性→整列收敛"的标准论证路径)中扮演关键角色。
记忆要点
弱收敛 = 依分布收敛 = 分布函数在连续点处逐点收敛。Portmanteau 定理给出五种等价刻画,Lévy 定理用特征函数判定,连续映射与 Slutsky 提供运算规则。它是四种收敛中最弱的,也是渐近推断的最后防线。核心直觉:弱收敛只关心"分布长什么样",不关心随机变量之间的逐点关系。