概率极限 (Probability Limit)
概率极限 (plim/依概率收敛 的极限)是渐近理论 中的核心概念:一随机变量序列{ X n } \{X_n\} { X n } 依概率收敛到常数c c c (记plim X n = c \operatorname{plim} X_n = c plim X n = c ,等价于X n → p c X_n \xrightarrow{p} c X n p c )当且仅当对任意ε > 0 \varepsilon>0 ε > 0 有lim n → ∞ P ( ∣ X n − c ∣ > ε ) = 0 \lim_{n\to\infty}P(|X_n-c|>\varepsilon)=0 lim n → ∞ P ( ∣ X n − c ∣ > ε ) = 0 。概率极限是大数定律 的形式化表达,也是一致性 估计量的理论根基。
数学定义
plim n → ∞ X n = c \operatorname{plim}_{n\to\infty} X_n = c plim n → ∞ X n = c 当∀ ε > 0 \forall\varepsilon>0 ∀ ε > 0 :
lim n → ∞ P ( ∣ X n − c ∣ > ε ) = 0 \lim_{n\to\infty} P(|X_n - c| > \varepsilon) = 0 n → ∞ lim P ( ∣ X n − c ∣ > ε ) = 0
区别于几乎必然收敛 (a.s.收敛⇒ \Rightarrow ⇒ 依概率收敛,反之不然)。依概率收敛允许X n X_n X n 以趋于零的概率偏离极限值。
plim运算规则(Slutsky定理推论)
若plim X n = a \operatorname{plim} X_n = a plim X n = a ,plim Y n = b \operatorname{plim} Y_n = b plim Y n = b ,g ( ⋅ ) g(\cdot) g ( ⋅ ) 在a a a 处连续:
plim ( X n + Y n ) = a + b \operatorname{plim}(X_n + Y_n) = a + b plim ( X n + Y n ) = a + b plim ( X n Y n ) = a b \operatorname{plim}(X_n Y_n) = ab plim ( X n Y n ) = ab plim ( X n / Y n ) = a / b \operatorname{plim}(X_n/Y_n) = a/b plim ( X n / Y n ) = a / b (b ≠ 0 b\neq0 b = 0 )plim g ( X n ) = g ( a ) \operatorname{plim}\, g(X_n) = g(a) plim g ( X n ) = g ( a ) (连续映射定理 )
计量经济学核心应用
OLS估计量 一致性 :β ^ n = β + ( X ′ X / n ) − 1 ( X ′ ε / n ) \hat{\beta}_n = \beta + (X'X/n)^{-1}(X'\varepsilon/n) β ^ n = β + ( X ′ X / n ) − 1 ( X ′ ε / n ) 。若plim ( X ′ X / n ) = Q X X \operatorname{plim}(X'X/n) = Q_{XX} plim ( X ′ X / n ) = Q XX (正定)且plim ( X ′ ε / n ) = 0 \operatorname{plim}(X'\varepsilon/n) = 0 plim ( X ′ ε / n ) = 0 (外生性 ),则plim β ^ n = β \operatorname{plim}\hat{\beta}_n = \beta plim β ^ n = β 。将不一致的估计量称为plim β ^ n ≠ β \operatorname{plim}\hat{\beta}_n \neq \beta plim β ^ n = β 。
工具变量 (IV) :当X X X 内生时,IV估计量β ^ I V = ( Z ′ X ) − 1 Z ′ y \hat{\beta}_{IV} = (Z'X)^{-1}Z'y β ^ I V = ( Z ′ X ) − 1 Z ′ y 满足plim β ^ I V = β \operatorname{plim}\hat{\beta}_{IV} = \beta plim β ^ I V = β 当plim ( Z ′ X / n ) = Q Z X \operatorname{plim}(Z'X/n) = Q_{ZX} plim ( Z ′ X / n ) = Q ZX (满秩)且plim ( Z ′ ε / n ) = 0 \operatorname{plim}(Z'\varepsilon/n) = 0 plim ( Z ′ ε / n ) = 0 (工具有效性)。
极大似然估计 :在正则条件下plim θ ^ M L E = θ 0 \operatorname{plim}\hat{\theta}_{MLE} = \theta_0 plim θ ^ M L E = θ 0 ,是一致渐近正态 (CAN)估计量的基础。
与期望/极限期望的区别
概率极限的核心优势在于它绕过了期望可能不存在的情形。即使E [ X n ] E[X_n] E [ X n ] 发散,plim X n \operatorname{plim} X_n plim X n 仍可能存在。例如Cauchy分布 无有限期望,但其样本中位数有概率极限。此外plim g ( X n ) = g ( plim X n ) \operatorname{plim} g(X_n) = g(\operatorname{plim} X_n) plim g ( X n ) = g ( plim X n ) (连续映射),而E [ g ( X n ) ] ≠ g ( E [ X n ] ) E[g(X_n)] \neq g(E[X_n]) E [ g ( X n )] = g ( E [ X n ]) 一般成立(Jensen不等式 ),使plim在非线性变换中更为便捷。
典型例子
样本均值:plim X ˉ n = μ \operatorname{plim}\bar{X}_n = \mu plim X ˉ n = μ (Khinchin大数定律 )。样本方差:plim s n 2 = σ 2 \operatorname{plim} s_n^2 = \sigma^2 plim s n 2 = σ 2 。样本协方差:plim Cov ^ ( X , Y ) = Cov ( X , Y ) \operatorname{plim}\widehat{\operatorname{Cov}}(X,Y) = \operatorname{Cov}(X,Y) plim Cov ( X , Y ) = Cov ( X , Y ) 。若θ ^ n \hat{\theta}_n θ ^ n 是一致估计量且Var ( θ ^ n ) → 0 \operatorname{Var}(\hat{\theta}_n)\to0 Var ( θ ^ n ) → 0 ,则θ ^ n \hat{\theta}_n θ ^ n 均方一致(→ q m \xrightarrow{qm} q m ),蕴含依概率收敛。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。