ARTICLE

平均绝对误差

平均绝对误差 (Mean Absolute Error, MAE) 平均绝对误差(Mean Absolute Error,简称 MAE)是统计学与计量经济学中衡量预测模型精度的基础指标。它定义为预测值与实际观测值之间绝对偏差的算术平均,公式为: 其中 y_i 为第 i 个观测的真实值, y_i 为模型预测值,n 为样本量。MAE 的量纲与原始变量一致,因此具

浏览 9 更新 2025-11-08

平均绝对误差 (Mean Absolute Error, MAE)

平均绝对误差(Mean Absolute Error,简称 MAE)是统计学与计量经济学中衡量预测模型精度的基础指标。它定义为预测值与实际观测值之间绝对偏差的算术平均,公式为:

MAE=1ni=1nyiy^i\text{MAE} = \frac{1}{n} \sum_{i=1}^{n} |y_i - \hat{y}_i|

其中 yiy_i 为第 ii 个观测的真实值,y^i\hat{y}_i 为模型预测值,nn 为样本量。MAE 的量纲与原始变量一致,因此具有直观的可解释性:它代表了预测误差绝对值的"典型"大小。

与 MSE 和 RMSE 的比较

MAE 与均方误差(MSE)和均方根误差(RMSE)是三大主流预测误差度量。三者的核心区别在于损失函数的形式:

  • MSE = 1ni=1n(yiy^i)2\frac{1}{n}\sum_{i=1}^{n} (y_i - \hat{y}_i)^2:平方损失,对离群值极其敏感,大误差被平方放大。
  • RMSE = MSE\sqrt{\text{MSE}}:MSE 的平方根,恢复原量纲,但仍继承了对大误差的敏感性。
  • MAE:绝对值损失,对离群值稳健,所有误差等权重。

选择 MAE 还是 RMSE 取决于应用场景。当关注典型误差且不希望少数极端偏差主导评估时,MAE 更合适;当大误差的代价不成比例地高昂时(如金融风险管理),RMSE 更合适。从数学性质看,MAE 最优预测值是条件中位数,而 MSE 最优预测值是条件均值——这意味着 MAE 对偏态分布数据更为稳健。

统计性质

MAE 作为损失函数对应 L1L_1 范数,具有以下性质:非负性MAE0\text{MAE} \geq 0,仅当所有预测完美时为零);尺度依赖性(量纲与原始变量相同,不适合跨量纲比较,此时应使用MAPE等相对指标);不可微性(绝对值函数在零处不可导,导致基于梯度的优化在理论上存在困难,但实践中可通过次梯度方法或平滑近似如Huber损失解决)。

对于独立同分布样本,MAE 是样本外绝对误差期望的一致估计量:MAEpE[YY^]\text{MAE} \xrightarrow{p} \mathbb{E}[|Y - \hat{Y}|]。其渐近方差可通过Delta方法推导,在大样本下可用于构建预测精度的置信区间。

在机器学习中的应用

机器学习中,MAE 常被用作回归模型的评估指标与训练损失函数。与 MSE 相比,MAE 的梯度恒为 ±1\pm 1(除零点外恒为常数),这意味着梯度下降更新步长不随误差大小缩放:对已拟合较好的样本,MAE 的梯度与拟合极差的样本相同。这一特性既是不足(收敛速度可能慢于 MSE)也是优势(不会被离群值"挟持"梯度方向)。

MAE 与分位数回归存在天然联系:MAE 最小化等价于中位数回归(τ=0.5\tau = 0.5 的分位数回归)。推广到非对称绝对损失可得任意分位数的估计,这构成了分位数回归的理论基础。

经济学与实证研究中的应用

在经济学实证研究中,MAE 广泛用于评估时间序列预测模型的样本外表现,如通货膨胀预测、GDP增长预测和股票收益率预测。与Diebold-Mariano检验配合,MAE 可用于比较两个预测模型是否具有统计显著的精度差异。

因果推断中,MAE 也用于评估匹配方法(如倾向得分匹配)的协变量平衡质量——匹配后处理组与对照组的协变量标准化均值差异越小(MAE 越低),匹配质量越高。此外在合成控制法中,预处理时期的 MAE 是选择最优预测变量权重的重要依据。

局限性

MAE 的主要局限在于:缺乏对误差方向的区分(同样大小的正负误差惩罚相同),在某些决策理论情境下不对称的损失函数更合理(如库存管理中缺货成本高于过剩成本);不能反映误差的分布特征(两个模型可能有相同的 MAE 但完全不同的误差模式);在模型选择中,MAE 不满足一致性(即随着样本量增大,MAE 不一定能选出真实模型),这与基于似然的准则如AICBIC形成对比。

尽管有上述局限,MAE 因其简洁性、稳健性和直观可解释性,仍然是科学研究和实际应用中最常用的预测精度指标之一。