ARTICLE

均方根误差 (Root Mean Squared Error, RMSE)

均方根误差 (Root Mean Squared Error, RMSE) 均方根误差（Root Mean Squared Error，简称RMSE）是统计学和机器学习中衡量预测值与真实值之间偏差的常用指标，定义为预测误差平方的均值的平方根。其数学表达式为：公式其中公式为第公式个观测的真实值，公式为对应的预测值，公式为样本量。RMSE 与

浏览 0 更新 2025-10-27

均方根误差 (Root Mean Squared Error, RMSE)

均方根误差（Root Mean Squared Error，简称RMSE）是统计学和机器学习中衡量预测值与真实值之间偏差的常用指标，定义为预测误差平方的均值的平方根。其数学表达式为：

\text{RMSE} = \sqrt{\frac{1}{n} \sum_{i=1}^{n} (y_i - \hat{y}_i)^2}

其中 $y_i$ 为第 $i$ 个观测的真实值， $\hat{y}_i$ 为对应的预测值， $n$ 为样本量。RMSE 与均方误差（MSE）同属一族评估指标，区别在于 RMSE 对 MSE 开平方，从而将量纲恢复至与原变量相同的单位，使得误差度量更直观可解释。RMSE 广泛用于回归分析、时间序列预测、气象学、金融建模和信号处理等领域。

数学性质与解释

RMSE 的数学本质是欧几里得范数在预测误差向量上的应用。令 $\mathbf{e} = (e_1, e_2, \dots, e_n)$ 表示误差向量，其中 $e_i = y_i - \hat{y}_i$ ，则 RMSE 可写为：

\text{RMSE} = \sqrt{\frac{\|\mathbf{e}\|_2^2}{n}} = \frac{\|\mathbf{e}\|_2}{\sqrt{n}}

这一形式揭示了 RMSE 与误差向量的 $\ell_2$ 范数之间的直接联系。从几何角度看，RMSE 衡量的是预测点 $\hat{\mathbf{y}}$ 与真实点 $\mathbf{y}$ 在 $n$ 维空间中的平均欧氏距离。这一性质使得 RMSE 成为最小二乘回归（Ordinary Least Squares, OLS）中的自然损失函数——OLS 估计量的目标正是最小化 $\|\mathbf{e}\|_2^2$ ，即最小化 MSE。

RMSE 满足以下数学性质：第一，RMSE $\geq 0$ ，当且仅当所有预测值与真实值完全相等时取零；第二，RMSE 对误差的平方赋予了不对称的权重——幅度较大的误差由于被平方，对 RMSE 的贡献远大于小误差，这使得 RMSE 对大偏差尤为敏感。这一特性既是优势也是风险：当数据中存在异常值时，RMSE 可能会被少数极端观测严重拉高，从而无法反映模型的整体表现。

RMSE 与相关指标的比较

RMSE 与 MAE（平均绝对误差）：平均绝对误差（Mean Absolute Error, MAE）定义为 $\text{MAE} = \frac{1}{n} \sum |y_i - \hat{y}_i|$ 。两者的核心差异在于误差的聚合方式：MAE 使用 $\ell_1$ 范数，对异常值的敏感度较低；RMSE 使用 $\ell_2$ 范数，在误差服从正态分布的条件下是最大似然估计所对应的损失函数（即最小二乘估计）。当误差分布具有厚尾特征时，MAE 通常比 RMSE 更稳健。在实际应用中，建议同时报告两个指标以获取更全面的模型评估。

RMSE 与 R²（决定系数）：决定系数 $R^2$ 衡量模型对因变量方差的解释比例，定义为 $R^2 = 1 - \frac{\sum (y_i - \hat{y}_i)^2}{\sum (y_i - \bar{y})^2}$ 。RMSE 与 $R^2$ 之间存在单调递减关系：RMSE 越小， $R^2$ 越接近 1。两者均基于残差平方和，因此对异常值的敏感性一致。但 RMSE 保留了原始量纲，便于跨数据集的比较； $R^2$ 是无量纲的标准化指标，更适合衡量同一数据集上不同模型的相对解释力。

RMSE 与 MSE（均方误差）：均方误差（MSE）是 RMSE 的平方，即 $\text{MSE} = \frac{1}{n} \sum (y_i - \hat{y}_i)^2$ 。在统计推断中，MSE 常用于分解为偏差（Bias）和方差（Variance）之和： $\text{MSE} = \text{Bias}^2 + \text{Variance}$ 。这构成了偏差-方差权衡（Bias-Variance Tradeoff）的理论基础——模型复杂度增加时，偏差下降但方差上升，最优模型复杂度位于总误差最小的平衡点。RMSE 的优势在于量纲一致性，便于实务人员直观理解预测误差的大小。

应用场景与注意事项

回归模型评估：在回归分析的各类场景中，RMSE 是模型选择与超参数调优的核心指标之一。在使用交叉验证评估模型泛化能力时，RMSE 常作为验证集上的主要性能度量。需要注意，RMSE 的数值高度依赖于目标变量的量级——同一模型在因变量取值范围不同的数据集上会得到差别显著的 RMSE 值，因此不应直接跨数据集比较 RMSE。

时间序列预测：在时间序列分析中，RMSE 广泛用于衡量预测模型的精度。气象学中预报气温的 RMSE（单位：°C）、金融领域中股票收益预测的 RMSE（单位：百分比）等，都是领域的标准评估基准。对于自回归（AR）或ARIMA模型，通常使用滚动预测窗口计算多个时间点的 RMSE，以评估模型在不同预测步长上的稳定性。

注意事项与局限性：

第一，RMSE 对异常值的高度敏感既是优点（便于检测预测中的极端偏差）也是缺点（可能掩盖模型在多数样本上的优良表现）。当数据异常值较多时，可考虑使用 Huber 损失或分位数损失等鲁棒替代指标。

第二，RMSE 没有上限——理论上可以趋于无穷大。这使得解释 RMSE 的绝对数值需要参照经验基准。常用的做法是计算标准化 RMSE（Normalized RMSE, NRMSE），即 $\text{NRMSE} = \text{RMSE} / (y_{\max} - y_{\min})$ 或 $\text{NRMSE} = \text{RMSE} / \bar{y}$ ，以便在不同量级的数据集间进行比较。

第三，RMSE 的平方操作放大了大误差的影响力，但这并不意味着 RMSE 一定是比 MAE "更好"的指标。选择哪个指标应取决于具体应用场景的目标函数。例如，在房价预测中，如果对异常高估或低估的代价是非对称的（如低估一栋豪宅的价格的代价远高于高估），则 RMSE 的对称平方损失可能并非最优选择。

第四，RMSE 假设误差项独立同分布。若误差序列存在自相关（如时间序列预测中的连续预测偏差），则 RMSE 的统计性质将受到影响，此时需考虑使用考虑了误差相关结构的评估指标。

数值示例

设某回归模型在 5 个样本上的预测值与真实值如下表所示：

\begin{tabular}{c|c|c} $i$ \& $y_i$ \& $\hat{y}_i$ \\ \hline 1 \& 3.0 \& 2.5 \\ 2 \& 4.5 \& 4.2 \\ 3 \& 5.0 \& 5.5 \\ 4 \& 6.5 \& 6.0 \\ 5 \& 8.0 \& 8.3 \end{tabular}

误差向量为： $\mathbf{e} = (0.5, 0.3, -0.5, 0.5, -0.3)$ 。计算平方误差： $(0.25, 0.09, 0.25, 0.25, 0.09)$ ，均值为 $0.186$ ，因此 $\text{RMSE} = \sqrt{0.186} \approx 0.431$ 。同一组数据的 MAE 为 $(0.5 + 0.3 + 0.5 + 0.5 + 0.3)/5 = 0.42$ 。本例中 RMSE 略大于 MAE，符合 $E[\text{RMSE}] \geq E[\text{MAE}]$ 的一般关系——当误差分布有正有负时，平方操作使 RMSE 对偏离方向不敏感但放大了幅度。

总结

均方根误差（RMSE）是预测模型评估中最经典、最广泛使用的指标之一。它衡量预测值与真实值之间的平均偏差，具有量纲一致、大误差权重高、与最小二乘估计天然契合等优势。然而，使用者需要充分理解其对异常值的敏感性、缺乏上限、跨数据不可直接比较等局限性。在实务中，将 RMSE 与 MAE、 $R^2$ 等指标配合使用，结合具体领域的误差代价函数，才能做出更加科学和稳健的模型选择决策。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。