ARTICLE
平均绝对误差
平均绝对误差 (Mean Absolute Error, MAE) 平均绝对误差(Mean Absolute Error,简称 MAE)是统计学与计量经济学中衡量预测模型精度的基础指标。它定义为预测值与实际观测值之间绝对偏差的算术平均,公式为: 其中 y_i 为第 i 个观测的真实值, y_i 为模型预测值,n 为样本量。MAE 的量纲与原始变量一致,因此具
平均绝对误差 (Mean Absolute Error, MAE)
平均绝对误差(Mean Absolute Error,简称 MAE)是统计学与计量经济学中衡量预测模型精度的基础指标。它定义为预测值与实际观测值之间绝对偏差的算术平均,公式为:
其中 为第 个观测的真实值, 为模型预测值, 为样本量。MAE 的量纲与原始变量一致,因此具有直观的可解释性:它代表了预测误差绝对值的"典型"大小。
与 MSE 和 RMSE 的比较
MAE 与均方误差(MSE)和均方根误差(RMSE)是三大主流预测误差度量。三者的核心区别在于损失函数的形式:
- MSE = :平方损失,对离群值极其敏感,大误差被平方放大。
- RMSE = :MSE 的平方根,恢复原量纲,但仍继承了对大误差的敏感性。
- MAE:绝对值损失,对离群值稳健,所有误差等权重。
选择 MAE 还是 RMSE 取决于应用场景。当关注典型误差且不希望少数极端偏差主导评估时,MAE 更合适;当大误差的代价不成比例地高昂时(如金融风险管理),RMSE 更合适。从数学性质看,MAE 最优预测值是条件中位数,而 MSE 最优预测值是条件均值——这意味着 MAE 对偏态分布数据更为稳健。
统计性质
MAE 作为损失函数对应 范数,具有以下性质:非负性(,仅当所有预测完美时为零);尺度依赖性(量纲与原始变量相同,不适合跨量纲比较,此时应使用MAPE等相对指标);不可微性(绝对值函数在零处不可导,导致基于梯度的优化在理论上存在困难,但实践中可通过次梯度方法或平滑近似如Huber损失解决)。
对于独立同分布样本,MAE 是样本外绝对误差期望的一致估计量:。其渐近方差可通过Delta方法推导,在大样本下可用于构建预测精度的置信区间。
在机器学习中的应用
在机器学习中,MAE 常被用作回归模型的评估指标与训练损失函数。与 MSE 相比,MAE 的梯度恒为 (除零点外恒为常数),这意味着梯度下降更新步长不随误差大小缩放:对已拟合较好的样本,MAE 的梯度与拟合极差的样本相同。这一特性既是不足(收敛速度可能慢于 MSE)也是优势(不会被离群值"挟持"梯度方向)。
MAE 与分位数回归存在天然联系:MAE 最小化等价于中位数回归( 的分位数回归)。推广到非对称绝对损失可得任意分位数的估计,这构成了分位数回归的理论基础。
经济学与实证研究中的应用
在经济学实证研究中,MAE 广泛用于评估时间序列预测模型的样本外表现,如通货膨胀预测、GDP增长预测和股票收益率预测。与Diebold-Mariano检验配合,MAE 可用于比较两个预测模型是否具有统计显著的精度差异。
在因果推断中,MAE 也用于评估匹配方法(如倾向得分匹配)的协变量平衡质量——匹配后处理组与对照组的协变量标准化均值差异越小(MAE 越低),匹配质量越高。此外在合成控制法中,预处理时期的 MAE 是选择最优预测变量权重的重要依据。
局限性
MAE 的主要局限在于:缺乏对误差方向的区分(同样大小的正负误差惩罚相同),在某些决策理论情境下不对称的损失函数更合理(如库存管理中缺货成本高于过剩成本);不能反映误差的分布特征(两个模型可能有相同的 MAE 但完全不同的误差模式);在模型选择中,MAE 不满足一致性(即随着样本量增大,MAE 不一定能选出真实模型),这与基于似然的准则如AIC、BIC形成对比。
尽管有上述局限,MAE 因其简洁性、稳健性和直观可解释性,仍然是科学研究和实际应用中最常用的预测精度指标之一。