误差平方和 (Sum of Squared Errors) 误差平方和 (Sum of Squared Errors, SSE),亦称残差平方和 (Residual Sum of Squares, RSS) 或剩余平方和,是回归分析和数理统计中衡量模型拟合误差的核心统计量。它定义为观测值与模型拟合值之差的平方和: SSE = _i=1^n (y_i - y_
浏览 0更新 2025-10-26
误差平方和 (Sum of Squared Errors)
误差平方和 (Sum of Squared Errors, SSE),亦称残差平方和 (Residual Sum of Squares, RSS) 或剩余平方和,是回归分析和数理统计中衡量模型拟合误差的核心统计量。它定义为观测值与模型拟合值之差的平方和:SSE=∑i=1n(yi−y^i)2,其中 yi 为第 i 个观测值,y^i 为相应的模型预测值,n 为样本量。SSE 度量了模型中未被解释的变异部分,其值越小表明模型对数据的拟合程度越高。在普通最小二乘法 (OLS) 的框架下,参数估计的核心目标正是使 SSE 达到最小。
平方和分解与几何解释
在含有截距项的线性回归模型中,观测值的总变异可分解为两个正交部分:
TSS=ESS+SSE
其中 TSS=∑i=1n(yi−yˉ)2 为总平方和 (Total Sum of Squares),度量因变量围绕其均值的总变异;ESS=∑i=1n(y^i−yˉ)2 为回归平方和 (Explained Sum of Squares),度量模型所能解释的结构性变异;而 SSE 为模型未能解释的随机变异。该分解的关键在于 OLS 残差 ϵ^i=yi−y^i 满足 ∑ϵ^i=0 且与拟合值正交。
从几何角度看,OLS 估计是将观测向量 y 正交投影到由设计矩阵 X 所张成的线性空间上,SSE 正是投影残差的欧几里得范数的平方。最小化 SSE 的一阶条件导出正规方程X′Xβ^=X′y,其解为 β^=(X′X)−1X′y。