Asymptotic Unbiasedness(渐近无偏性)
渐近无偏性(Asymptotic Unbiasedness)是大样本理论中的核心概念,指随着样本容量趋向无穷,估计量的期望值收敛于真实参数。形式上,对于参数 θ 及估计量序列 {θ^n}n=1∞,渐近无偏性定义为:
n→∞limE[θ^n]=θ
等价地,limn→∞Bias(θ^n)=0。该性质是一致性的必要但不充分条件——一个估计量可以渐近无偏但不一致(若其方差在极限下不趋于零),也可以一致但存在有限样本偏差。
与有限样本无偏性的区别
有限样本无偏性(E[θ^n]=θ 对所有 n 成立)是一个更强的要求。许多重要的估计量仅满足渐近无偏性而非有限样本无偏性。典型例子包括:
样本方差:使用分母 n 的估计量 σ^n2=n1∑i=1n(Xi−Xˉ)2 是有偏的(E[σ^n2]=nn−1σ2),但 limn→∞E[σ^n2]=σ2,因此是渐近无偏的。经过贝塞尔校正(分母换为 n−1)可获得有限样本无偏性,这一区别在大样本中变得可忽略。
极大似然估计量(MLE):在正则条件下,MLE 是一致且渐近正态的,但通常在小样本中是有偏的。例如,正态分布方差 σ2 的 MLE σ^MLE2=n1∑i=1n(Xi−Xˉ)2 存在偏差 −σ2/n,该偏差随 n 增大而消失。
工具变量估计量:两阶段最小二乘法(2SLS)在有限样本中是有偏的,尤其当工具变量较弱时——其期望值甚至不存在(矩不存在问题)。然而在标准渐近框架下,2SLS 是一致的且渐近无偏。这一问题催生了弱工具变量诊断、LIML 估计量和无偏 Jackknife IV 的发展。
与一致性及渐近正态性的关系
渐近无偏性、一致性和渐近正态性构成了大样本估计理论的三块基石,但三者之间并非简单的包含关系:
一致性意味着渐近无偏性(若 θ^npθ 且 θ^n 一致可积,则 E[θ^n]→θ),但反之不然。反例:设 θ^n∼N(θ,1),则 E[θ^n]=θ(无偏),但 Var(θ^n)→0,该估计量不一致。
渐近无偏性是构造渐近置信区间的逻辑前提。若 n(θ^n−θ)dN(0,Σ),则渐近无偏性蕴含于渐近正态性之中(期望收敛到零)。基于此的Wald 检验和Delta 方法是计量经济学中最常用的推断工具。
渐近偏差与高阶渐近理论
渐近偏差研究偏差收敛于零的速率。通过 Edgeworth 展开或 Nagar 展开,可将估计量的期望写为:
E[θ^n]=θ+nB1+n2B2+O(n31)
其中 B1/n 为一阶偏差项。这一分解在以下场景中具有实际意义:
面板数据固定效应模型:Nickell 偏差(Nickell, 1981)描述了动态面板模型中组内估计量的渐近偏差 −T−11+ϕ(其中 ϕ 为自回归系数,T 为时间维度),即使 N→∞ 也不会消失。这推动了Arellano-Bond 估计量和 Blundell-Bond 系统 GMM 的发展。
偏差校正方法:当一阶偏差序列 B1 可识别时,可通过解析校正(如解析偏差校正的 MLE)、Bootstrap 偏差校正或 Jackknife 方法消除 O(1/n) 偏差,提升有限样本性能。在高维计量经济学中,去偏差 LASSO 使用修正的 Karush-Kuhn-Tucker 条件构造渐近无偏且渐近正态的低维参数推断。
广义方法中的渐近无偏性
广义矩方法(GMM)的渐近性质建立了更一般的框架:在矩条件 E[g(Zi,θ0)]=0 下,GMM 估计量在满足识别和正则条件时是渐近无偏且一致的。然而在弱识别(weak identification)情形中,即使 n→∞,θ^GMM 的渐近分布也是非标准且存在渐近偏差的,这构成 Stock 和 Wright (2000) 及后续弱识别稳健推断文献的核心关切。
半参数估计进一步放松参数假设,在无限维干扰参数存在时仍保持有限维参数的渐近无偏性。部分线性模型、Cox 比例风险模型和倾向得分匹配均依赖渐近无偏性证明其估计量在以 n 速率收敛时不受干扰参数估计的渐近污染。