克拉默-拉奥下界 (Cramér-Rao Lower Bound)
克拉默-拉奥下界(CRLB)是数理统计中估计理论的核心定理。它为任意确定性参数的无偏估计量的方差设定了一个理论下界:无论估计方法如何精巧,只要无偏,其方差就不可能低于此界。CRLB因此成为评估估计量性能的黄金基准——达到该下界的无偏估计量称为有效估计量。该理论由瑞典数学家Harald Cramér和印度裔美国统计学家Calyampudi Radhakrishna Rao独立提出。
理论陈述
设未知确定性参数 θ,随机样本 X=(X1,…,Xn) 服从参数化分布 f(x;θ)。令 θ^(X) 为任意无偏估计量,即 E[θ^]=θ。在正则性条件下:
Var(θ^)≥I(θ)1
右侧即为CRLB,其中 I(θ) 是费雪信息。
费雪信息 (Fisher Information)
费雪信息 I(θ) 度量样本所含关于 θ 的信息量——信息量越大,估计越精确。对单个观测,定义为Score函数平方的期望:
I(θ)=E[(∂θ∂lnf(X;θ))2θ]
正则条件下等价于对数似然二阶导的负期望:
I(θ)=−E[∂θ2∂2lnf(X;θ)θ]
此形式揭示费雪信息即对数似然函数在 θ 处的曲率:曲率越大,似然峰越尖锐,数据对参数越敏感,信息量越大。对 n 个独立同分布样本,In(θ)=nI(θ),故:
Var(θ^)≥nI(θ)1
样本量 n 越大,方差下界越小——"数据越多,估计越准"。
有效估计量
若无偏估计量方差恰好等于CRLB,即 Var(θ^)=1/I(θ),则称有效估计量——它充分利用了样本信息,达到理论最优精度。重要结论:最大似然估计量(MLE)在正则条件下是渐近有效的,即 n→∞ 时MLE方差收敛于CRLB。
示例:估计正态均值
设 X1,…,Xn∼N(μ,σ2) i.i.d.,σ2 已知,估计 μ。单个样本对数似然:
lnf(xi;μ)=−21ln(2πσ2)−2σ2(xi−μ)2
求二阶导得 ∂μ2∂2lnf=−σ21,故 I(μ)=1/σ2,In(μ)=n/σ2。CRLB为 σ2/n。样本均值 Xˉ 的方差恰为 σ2/n,因此样本均值是估计正态均值的有效估计量。
扩展与局限
- 有偏估计量:经典CRLB仅适用于无偏情形。有偏估计量存在扩展形式——其方差可低于CRLB,但以引入偏差为代价,体现偏差-方差权衡。
- 多参数推广:同时估计多参数时,费雪信息推广为费雪信息矩阵,其逆矩阵对角元给出各参数方差下界。
- 正则性条件:CRLB依赖求导与积分可交换等正则条件。对于支撑集依赖参数的分布(如均匀分布),条件不满足,CRLB可能不适用。