估计 (Estimation)
估计是利用样本推断总体未知参数数值的过程→连接理论与数据的核心桥梁。区分:估计量(计算规则/公式→随机变量,如Xˉ=(1/n)∑Xi);估计值(代入具体数据的特定数值,如175cm)。
估计类型
点估计:样本数据算单一值→为未知参数"最佳猜测"(xˉ估μ、p^估p、s2估σ2)。简洁但无不确定性信息→不知偏离真值多远。
区间估计:数值范围→以置信水平相信范围包含真值(称置信区间)。如μ95\%CI=[172,178]→非真值95\%概率在区间(μ固定常数)→而是重复抽样构造的区间中约95\%包含μ。量化抽样不确定性→区间越窄精确度越高。
估计方法
矩估计法(MOM):令总体k阶矩=样本k阶矩→解方程组→θ^MOM。例估μ,σ2:E[X]=μ=Xˉ;E[X2]=σ2+μ2=(1/n)∑Xi2→代入μ^=Xˉ解σ^2。
最大似然估计(MLE):找θ使观察到的数据出现概率/似然最大。似然函数L(θ∣x)=∏f(xi;θ)→最大化(通常用对数lnL)。大样本下优良:一致性+渐近正态性+渐近有效性。
最小二乘估计(LSE):用于回归分析→选参数使模型预测值与实际值的残差平方和最小:min∑(yi−(β0+β1xi))2。线性回归即OLS→有显式解析解。
估计量性质
无偏性:E[θ^]=θ→单次可能高于/低于真值→但无数次重复平均精确指向真值。偏误Bias=E[θ^]−θ(无偏→偏误=0)。
有效性:所有无偏估计量中方差最小者最优→更紧密围绕真值→波动小更可靠。线性模型下满足最小方差无偏→BLUE(高斯-马尔可夫定理)。
一致性(渐近性质):n→∞时θ^n依概率收敛于θ(θ^npθ)→数据够多→任意近真值→大数定律保证。
充分性:充分统计量含样本关于θ全部信息→给定T后原始数据不再提供额外信息→好估计量常为充分统计量的函数。