ARTICLE

弱收敛

弱收敛 (Weak Convergence) 弱收敛 (Weak Convergence) 是 概率论 与 测度论 中的核心收敛概念,描述一列概率测度(或随机变量)在分布意义上的极限行为。在概率论中,弱收敛与 依分布收敛 (Convergence in Distribution) 等价,是四种经典随机收敛模式中要求最弱的一种。其理论基石由 Alexandro

浏览 0 更新 2025-12-04

弱收敛 (Weak Convergence)

弱收敛 (Weak Convergence) 是 概率论测度论 中的核心收敛概念,描述一列概率测度(或随机变量)在分布意义上的极限行为。在概率论中,弱收敛与 依分布收敛 (Convergence in Distribution) 等价,是四种经典随机收敛模式中要求最弱的一种。其理论基石由 Alexandroff、Kolmogorov、Prokhorov 等数学家在 20 世纪中叶奠定,现已成为 计量经济学统计学 中渐近理论 (Asymptotic Theory) 的基本语言。

定义

S S 是一个可度量空间,配备 Borel σ \sigma -代数 B(S) \mathcal{B}(S) 。设 {Pn}n=1 \{P_n\}_{n=1}^\infty P P (S,B(S)) (S, \mathcal{B}(S)) 上的概率测度。称 Pn P_n 弱收敛P P ,记作 PnwP P_n \xrightarrow{w} P ,若对任意有界连续实值函数 fCb(S) f \in C_b(S) ,有:

SfdPnSfdP,n.\int_S f \, dP_n \longrightarrow \int_S f \, dP, \quad n \to \infty.

对随机变量而言:设 {Xn}n=1 \{X_n\}_{n=1}^\infty X X 是取值于 S S 的随机元,分别定义在不必相同的概率空间上,分布为 Pn=PXn1 P_n = \mathbb{P} \circ X_n^{-1} P=PX1 P = \mathbb{P} \circ X^{-1} 。称 Xn X_n 依分布收敛X X ,记作 XndX X_n \xrightarrow{d} X ,当且仅当其分布的弱收敛 PnwP P_n \xrightarrow{w} P 成立。

特别地,当 S=R S = \mathbb{R} 时,用分布函数 (CDF) 判定更为直观:设 Fn(x)=P(Xnx) F_n(x) = P(X_n \le x) F(x)=P(Xx) F(x) = P(X \le x) ,则 XndX X_n \xrightarrow{d} X 当且仅当在 F F 的每个连续点 x x 处有:

limnFn(x)=F(x).\lim_{n\to\infty} F_n(x) = F(x).

Portmanteau 定理(等价刻画)

弱收敛具有多个等价刻画,统称为 Portmanteau 定理 (Portmanteau Theorem)。以下命题等价:

  1. PnwP P_n \xrightarrow{w} P
  2. 对任意开集 GS G \subset S lim infnPn(G)P(G) \liminf_n P_n(G) \ge P(G)
  3. 对任意闭集 FS F \subset S lim supnPn(F)P(F) \limsup_n P_n(F) \le P(F)
  4. 对任意满足 P(A)=0 P(\partial A) = 0 的 Borel 集 A A (即 A A P P -连续集),limnPn(A)=P(A) \lim_n P_n(A) = P(A)
  5. 对任意有界 Lipschitz 函数 f f fdPnfdP \int f dP_n \to \int f dP

其中条件 (4) 在 渐近理论 中尤为实用:通过选取合适的 P P -连续集 A A ,可避免在边界上发生概率堆积的复杂情形。条件 (5) 则将检验函数从 Cb(S) C_b(S) 缩减为 Lipschitz 族,在实际验证中提供便利。

特征函数与 Lévy 连续性定理

S=Rk S = \mathbb{R}^k 时,弱收敛可通过 特征函数 (Characteristic Function) 得到优雅刻画。记 φn(t)=E[eitXn] \varphi_n(t) = \mathbb{E}[e^{i t' X_n}] φ(t)=E[eitX] \varphi(t) = \mathbb{E}[e^{i t' X}]

Lévy 连续性定理 (Lévy Continuity Theorem):XndX X_n \xrightarrow{d} X 当且仅当对每个 tRk t \in \mathbb{R}^k φn(t)φ(t) \varphi_n(t) \to \varphi(t) (逐点收敛)。更进一步,若 φn(t) \varphi_n(t) 逐点收敛到某个在原点连续的函数 φ(t) \varphi(t) ,则 φ \varphi 必为某随机向量 X X 的特征函数,且 XndX X_n \xrightarrow{d} X

该定理是证明 中心极限定理 (Central Limit Theorem) 的标准工具:将标准化部分和的分布弱收敛问题转化为其特征函数在 t=0 t = 0 附近的 Taylor 展开分析。

连续映射定理与 Slutsky 定理

弱收敛的两个核心运算法则是渐近推断的基础:

连续映射定理 (Continuous Mapping Theorem, CMT):若 XndX X_n \xrightarrow{d} X g:ST g: S \to T PX P_X 的支撑上几乎处处连续,则 g(Xn)dg(X) g(X_n) \xrightarrow{d} g(X) 。该结果使 Delta方法 等工具成为可能——将复杂统计量的分布收敛问题转化为对简单统计量施加连续变换。

Slutsky 定理:若 XndX X_n \xrightarrow{d} X Ynpc Y_n \xrightarrow{p} c (依概率收敛到常数 c c ),则:

Xn+YndX+c,XnYndcX,XnYndXc(c0).X_n + Y_n \xrightarrow{d} X + c, \quad X_n Y_n \xrightarrow{d} cX, \quad \frac{X_n}{Y_n} \xrightarrow{d} \frac{X}{c} \quad (c \neq 0).

这一结果在计量经济学中至关重要:当用一致估计量替代未知参数(如用 s2 s^2 替代 σ2 \sigma^2 )时,Slutsky 定理保证统计量的渐近分布不受影响,从而支持 Wald检验t检验 的大样本有效性。

与其他收敛模式的关系

Xn X_n X X 定义在同一概率空间上,四种经典收敛模式的关系为:

几乎必然收敛 (a.s.)    依概率收敛 (p)    依分布收敛/弱收敛 (d),\text{几乎必然收敛 (a.s.)} \;\Longrightarrow\; \text{依概率收敛 (p)} \;\Longrightarrow\; \text{依分布收敛/弱收敛 (d)},
Lp收敛    依概率收敛    弱收敛.L^p \text{收敛} \;\Longrightarrow\; \text{依概率收敛} \;\Longrightarrow\; \text{弱收敛}.

弱收敛是其中最弱的要求——它不要求随机变量定义在相同概率空间,也不关心逐点行为,仅关注分布层面的逼近。因此,弱收敛是渐近统计中唯一"默认可用"的收敛模式:当更强的收敛无法证明时,弱收敛往往是留下的最后防线。

一个关键反例:XndX X_n \xrightarrow{d} X 不能 推出 XnXd0 X_n - X \xrightarrow{d} 0 ;事实上 Xn X_n X X 甚至可以相互独立。这意味着弱收敛不传递差分信息,在构造置信区间时需借助 Slutsky 定理或更为精细的 Bootstrap 方法加以补救。

计量经济学中的应用

弱收敛是现代 计量经济学 渐近理论的底层语言:

  • 极大似然估计 (MLE):在一定正则条件下,n(θ^nθ0)dN(0,I(θ0)1) \sqrt{n}(\hat{\theta}_n - \theta_0) \xrightarrow{d} N(0, I(\theta_0)^{-1}) ,其中 I(θ0) I(\theta_0) 是 Fisher 信息矩阵。该结论的严格证明依赖于弱收敛框架下的 Cramér-Rao下界 讨论和 Taylor 展开。
  • GMM 估计:Hansen 的 广义矩估计 (GMM) 中,矩条件的样本平均依中心极限定理弱收敛于正态分布,进而通过 Delta 方法传递到参数估计量。
  • 单位根与协整:在 单位根检验 (Dickey-Fuller) 中,检验统计量弱收敛于布朗运动的泛函而非正态分布,这一"非标准分布"现象深刻改变了推断程序。

紧致性与 Prokhorov 定理

弱收敛理论中,Prokhorov 定理 提供了紧致性判据:一族概率测度 P \mathcal{P} 胎紧的 (Tight) 当且仅当其在弱拓扑下是相对紧的——即任意序列均存在弱收敛子列。该结果在证明估计量存在渐近分布(即"紧致→子列收敛→识别极限唯一性→整列收敛"的标准论证路径)中扮演关键角色。

记忆要点

弱收敛 = 依分布收敛 = 分布函数在连续点处逐点收敛。Portmanteau 定理给出五种等价刻画,Lévy 定理用特征函数判定,连续映射与 Slutsky 提供运算规则。它是四种收敛中最弱的,也是渐近推断的最后防线。核心直觉:弱收敛只关心"分布长什么样",不关心随机变量之间的逐点关系。