费雪信息 (Fisher Information)
费雪信息由费雪提出→量化随机变量观测值含多少关于分布未知参数的信息。高→数据对参数微小变化敏感→可做精确估计;低→对参数变化不敏感→估计不确定性大。
得分函数:对数似然关于θ一阶导→S(θ)=∂logf(X;θ)/∂θ。在正则性条件下→E[S(θ)]=0。费雪信息=得分函数方差:I(θ)=Var[S(θ)]=E[(S(θ))2]→得分波动大→似然对θ敏感→信息多。等价形式(更便算):I(θ)=−E[∂2logf/∂θ2]→几何直观:对数似然峰值处曲率→曲率越大峰越锐→信息越大。
关键性质
非负性I≥0(方差特性)。可加性:n个独立同分布观测→In(θ)=n⋅I1(θ)(数据多→信息多)。重参数化:η=g(θ)→Iη(η)=Iθ(θ)(dθ/dη)2。充分性:若T为充分统计量→基于T的费雪信息=基于原始数据的→信息论证充分统计量确含全部信息。
核心应用
克拉默-拉奥下界(CRLB):任无偏估计量θ^→Var(θ^)≥1/I(θ)→设定所有无偏估计量精度理论极限→达CRLB的称有效估计量。
MLE渐近论:大样本下n(θ^MLE−θ)dN(0,1/I1(θ))(渐进无偏+方差达CRLB→依分布收敛)→可用费雪信息构建置信区间和假设检验。
实验设计:选实验条件最大化数据中费雪信息→用最少资源获最精确估计。
示例:伯努利
f(x;p)=px(1−p)1−x。得分∂ℓ/∂p=x/p−(1−x)/(1−p)。二阶导∂2ℓ/∂p2=−x/p2−(1−x)/(1−p)2。I(p)=−E[∂2ℓ/∂p2]=E[X]/p2+E[1−X]/(1−p)2=1/p+1/(1−p)=1/[p(1−p)]。p=0.5→分母最大0.25→I最小4(最不确定→单观测信息少);p→0或1→分母趋0→I趋∞(极端概率下偶观"成功"极大更新认知)。
多元:费雪信息矩阵
参数θ∈Rk→费雪信息矩阵FIM:[I(θ)]ij=−E[∂2logf/∂θi∂θj](k×k对称)。CRLB推广:Cov(θ^)≥[I(θ)]−1→Cov−I−1为半正定。