ARTICLE
Mean Absolute Error
平均绝对误差 (Mean Absolute Error) 平均绝对误差,英文为 Mean Absolute Error,通常缩写为 MAE,是统计学、计量经济学和机器学习中最常用的预测精度度量指标之一。它衡量的是预测值与实际观测值之间绝对偏差的平均水平。与均方误差 (MSE) 不同,MAE 采用绝对值而非平方来处理误差,因此它对离群值具有更好的稳健性 (Ro
平均绝对误差 (Mean Absolute Error)
平均绝对误差,英文为 Mean Absolute Error,通常缩写为 MAE,是统计学、计量经济学和机器学习中最常用的预测精度度量指标之一。它衡量的是预测值与实际观测值之间绝对偏差的平均水平。与均方误差 (MSE) 不同,MAE 采用绝对值而非平方来处理误差,因此它对离群值具有更好的稳健性 (Robustness),并且保持了与原始数据相同的量纲。
MAE 作为一种损失函数(即 L1损失函数),其优化问题与中位数回归存在天然联系。理解 MAE 的性质、优势与局限,对于正确选择模型评估指标和构建鲁棒预测系统至关重要。
定义与数学表达
给定一组观测值 和对应的预测值 (其中 ),平均绝对误差的定义为所有绝对误差的算术平均:
其中 表示第 个预测值与实际值之间的绝对偏差,也称为 绝对误差 (Absolute Error)。MAE 的取值范围为 ,数值越小表明模型的预测精度越高,当 MAE = 0 时表示完美预测。
与 MSE 的对比:
- MAE:,量纲与 相同,对大误差施加线性惩罚。
- MSE:,量纲为 的平方,对大误差施加平方级惩罚。
- RMSE:,量纲与 相同,对大误差施加平方级惩罚。
数学性质
线性惩罚与异常值稳健性
MAE 最显著的特性是对每个误差施加与误差大小成正比的线性惩罚。相比之下,MSE 对误差进行平方惩罚——一个误差为 10 的观测对 MSE 的贡献是误差为 1 的观测的 100 倍,而对 MAE 的贡献仅为 10 倍。这意味着:
- MAE 对异常值 (Outliers) 不敏感:单个极端预测误差不会主导 MAE 的计算结果。
- MSE 倾向于惩罚大误差:MSE 的最优解对异常值极为敏感。
可微性问题与次梯度
MAE 在误差为 0 处不可微。为了在基于梯度的优化方法中使用 MAE,通常引入次梯度 (Subgradient) 的概念。研究者提出了多种 MAE 的平滑近似,例如 Huber 损失 (Huber Loss):
e^2 \& |e| \le \\ \left(|e| - \right) \& |e| >
其中 是阈值参数,控制着从平方损失到线性损失的切换点。
与中位数的关系
MAE 具有一个深刻的统计特性:在给定一组实数值的情况下,使 MAE 最小化的预测值是中位数 (Median),而非均值。这一性质推广到回归模型中即成为 中位数回归 (Median Regression) 或 分位数回归 (Quantile Regression):最小化 MAE 的回归线估计的是 的条件中位数 ,而非条件均值 (后者是 MSE 回归的目标)。
评价与应用场景
在预测评估中的使用
可解释性优势:一个 MAE 为 5 的模型意味着「平均而言,预测值与真实值相差 5 个单位」。这种与原始量纲直接对应的特性使得 MAE 在面向非技术受众的报告和仪表板中极受欢迎。
适用场景:
- 时间序列预测:在供应链预测、需求预测、能源负荷预测等领域,MAE 常作为主要或辅助评价指标。
- 存在已知测量误差或数据录入错误的场景。
- 损失与误差呈线性关系时的决策问题。
与 MAPE、MdAE 的关系
MAPE (Mean Absolute Percentage Error):
MAPE 是 MAE 的标准化版本,便于跨数据集比较。其缺陷包括:当真实值为 0 时无法定义;对较小的真实值会产生极大的百分比误差。
MdAE (Median Absolute Error):
MdAE 将稳健性理念推进了一步:汇总统计量也采用中位数而非均值。
在模型训练中的使用
在机器学习中,MAE 作为 L1 损失被直接用于训练模型。在深度学习中,L1 损失也常用于图像生成任务和鲁棒回归任务。此外,L1 正则化 (Lasso) 虽然与 MAE 损失函数在数学形式上共享绝对值结构,但其作用于参数而非预测误差,用于诱导稀疏性。
MAE 与 MSE 的选择指南
- 数据含异常值、需直观解释、误差损失为线性时:推荐 MAE。
- 需处处可微、假设误差服从正态分布、大误差后果严重时:推荐 MSE/RMSE。
- 实践中通常同时报告 MAE 和 RMSE:两者之比 可以反映误差分布的离散程度。对于误差服从正态分布的数据,。
在计量经济学中的角色
在计量经济学的预测评价中,MAE 与 RMSE、Theil's U 等指标一同出现在模型选择工具箱中。Diebold-Mariano 检验等预测比较检验可以基于绝对误差损失来判定两个预测模型之间的差异是否具有统计显著性,进一步巩固了 MAE 在严谨实证研究中的地位。