ARTICLE

均方误差

均方误差 (MSE) MSE是统计学/计量经济学/机器学习最常用模型性能指标→预值 Y_i与真值Y_i差平方均值: MSE=(1/n) (Y_i- Y_i)^2。理论定义(估计量 vs真实 ): MSE( )=E[( - )^2]。 偏差-方差分解 MSE最深刻特性→可分解: MSE( )= Var( )+[ Bias( )]^2。 偏差Bias=E[ ]-

浏览 35 更新 2025-10-23

均方误差 (MSE)

MSE统计学/计量经济学/机器学习最常用模型性能指标→预值Y^i\hat{Y}_i与真值YiY_i差平方均值:MSE=(1/n)(YiY^i)2\mathrm{MSE}=(1/n)\sum(Y_i-\hat{Y}_i)^2。理论定义(估计量θ^\hat{\theta}vs真实θ\theta):MSE(θ^)=E[(θ^θ)2]\mathrm{MSE}(\hat{\theta})=E[(\hat{\theta}-\theta)^2]

偏差-方差分解

MSE最深刻特性→可分解:MSE(θ^)=Var(θ^)+[Bias(θ^)]2\mathrm{MSE}(\hat{\theta})=\mathrm{Var}(\hat{\theta})+[\mathrm{Bias}(\hat{\theta})]^2

偏差Bias=E[θ^]θE[\hat{\theta}]-\theta:模型预测期望与真值差→系统性方向性错误。高偏差→模过简→欠拟合(直线拟二次);低偏→预测平均准确命中真值→偏差0为无偏

方差Var=E[(θ^E[θ^])2E[(\hat{\theta}-E[\hat{\theta}])^2:预测对不同训练集的敏感度/波动性。高方差→模过复→过拟合(记训练噪声→训集好新数据差);低方差→预测稳定一致。

推导:加/减E[θ^]E[\hat{\theta}]→展开((θ^E[θ^])+(E[θ^]θ))2((\hat{\theta}-E[\hat{\theta}])+(E[\hat{\theta}]-\theta))^2→三项→交叉项期望为零→得分解。总误差=系统偏差+随波动。低偏→常提方差;反之→偏差-方差权衡正则化等技术目标找最佳平衡最小MSE。

特点与应用

平方优势:惩罚大误差(误差>1贡献增大→大误优先避);消符号(保均正项);凸函数→可微→优化便→线性回归通过最小MSE(残差平方和)求解→普通最小二乘法→解析解/梯度下降。用作回归默认损失函数

RMSE=MSE=\sqrt{\mathrm{MSE}}→与原数据同单位→更具解释性。MAE=(1/n)YiY^i=(1/n)\sum|Y_i-\hat{Y}_i|→线性权重→对离群值敏感度低于MSE→含极端异常值时更优。MSE在正态误差假设下OLS=MLE→理论根基坚实。

局限:离群值敏感(平方放大→单极值可不成比例拉高MSE);尺度依赖(不同范围变量不可直接比);解释性劣RMSE。