伽马分布无偏估计量 (Unbiased Estimator for Gamma Distribution)
在统计推断中,无偏估计量指估计量的期望值等于所估计未知参数的真值。对伽马分布参数的估计——尤其形状参数的估计——是一个重要的统计理论课题:常用的最大似然估计(MLE)存在系统性偏误,寻找无偏或近似无偏估计量需要借助充分统计量理论和偏差校正方法。
伽马分布与MLE偏误
伽马分布的概率密度函数为f(x;α,β)=(βα/Γ(α))xα−1e−βx(x>0),其中α>0为形状参数、β>0为率参数(也可用尺度参数θ=1/β参数化)。期望E[X]=α/β,方差Var(X)=α/β2。
给定来自伽马分布的独立同分布样本x1,…,xn,对数似然函数为ℓ(α,β)=n(αlnβ−lnΓ(α))+(α−1)∑lnxi−β∑xi。求解一阶条件得β^=α^/xˉ,其中xˉ为样本均值。联合方程简化为ln(α)−ψ(α)=ln(xˉ)−(1/n)∑lnxi,其中ψ(α)=Γ′(α)/Γ(α)为digamma函数——此方程无解析解需通过牛顿法等数值方法求解。
核心问题:通过蒙特卡洛模拟和理论分析可证明α^MLE是有偏估计量——其期望系统性高于真实α值(正向偏误),在小样本量下尤为显著。虽具有渐近无偏性(n→∞时偏误趋于零),但小样本场景普遍的应用中偏误可能导致错误推断。
无偏估计量的构造
根据统计理论,寻找一致最小方差无偏估计量(UMVUE)通常依赖Lehmann-Scheffé定理——若一个充分统计量是完备性的,则基于该统计量的无偏估计函数唯一且达最小方差。对伽马分布族(α,β均未知),二维充分统计量为T1=∑Xi和T2=∏Xi且为完备统计量——理论上应存在函数g(T1,T2)使期望等于目标参数,但寻找该函数涉及求解复杂积分方程,通常无法得到对形状参数的简单闭式解。
特殊情况。若形状参数α已知,对参数β或尺度参数θ=1/β可获得闭式无偏估计——β^=(αn−1)/∑Xi是β的无偏估计。若β已知,充分统计量∑Xi服从伽马分布,可直接构造——但因实践中参数均未知,这些简化情况不具一般性。
偏误校正方法实操上常用以下手段。基于模拟或渐近展开的偏差校正可减去估计偏误项的近似值;Jackknife和Bootstrap偏差校正利用重抽样技术估计并校正偏误;贝叶斯方法结合先验信息可在小样本下产生更合理的估计。在可靠性工程、保险精算和排队论等领域应用中准确估计伽马参数至关重要——因偏误可能导致对系统性能或风险的严重误判。伽马分布的无偏估计是展示参数估计偏误问题和充分统计量完备性理论应用的经典教材案例。