ARTICLE

残差平方和 (Sum of Squares Error, SSE)

残差平方和 (Sum of Squares Error, SSE) 残差平方和(Sum of Squares Error,简称 SSE),也称为误差平方和或剩余平方和,是回归分析中衡量模型拟合优度的核心统计量之一。它定义为观测值 y_i 与模型预测值 y_i 之差的平方和,反映模型未能解释的变异部分。SSE 越小,意味着模型对数据的拟合效果通常越好;反之,S

浏览 0 更新 2025-10-26

残差平方和 (Sum of Squares Error, SSE)

残差平方和(Sum of Squares Error,简称 SSE),也称为误差平方和剩余平方和,是回归分析中衡量模型拟合优度的核心统计量之一。它定义为观测值 yiy_i 与模型预测值 y^i\hat{y}_i 之差的平方和,反映模型未能解释的变异部分。SSE 越小,意味着模型对数据的拟合效果通常越好;反之,SSE 越大,说明模型的预测偏差越大。

数学定义

对于包含 nn 个观测值的回归模型,SSE 的数学表达式为:

SSE=i=1n(yiy^i)2\text{SSE} = \sum_{i=1}^{n} (y_i - \hat{y}_i)^2

其中 yiy_i 为第 ii 个因变量的实际观测值,y^i\hat{y}_i 为模型对该观测值的拟合值或预测值。在普通最小二乘法(OLS)框架下,参数估计的目标正是通过最小化 SSE 来求解:

β^=argminβi=1n(yixiβ)2\hat{\boldsymbol{\beta}} = \arg\min_{\boldsymbol{\beta}} \sum_{i=1}^{n} (y_i - \mathbf{x}_i'\boldsymbol{\beta})^2

这使得 OLS 估计量在经典线性模型假设下具备最小方差无偏估计(BLUE)的性质(高斯-马尔可夫定理)。

平方和分解

在回归分析中,总平方和(SST)、回归平方和(SSR)与残差平方和(SSE)三者之间满足平方和分解关系:

SST=SSR+SSE\text{SST} = \text{SSR} + \text{SSE}

其中 SST=(yiyˉ)2\text{SST} = \sum (y_i - \bar{y})^2 度量因变量的总变异,SSR=(y^iyˉ)2\text{SSR} = \sum (\hat{y}_i - \bar{y})^2 度量模型解释的变异。这一分解成立的前提是回归方程包含截距项。基于此分解,可以构造拟合优度指标:

R2=SSRSST=1SSESSTR^2 = \frac{\text{SSR}}{\text{SST}} = 1 - \frac{\text{SSE}}{\text{SST}}

R2R^2 的取值范围为 [0,1][0, 1],它表示模型解释的变异占总变异的比例。当 SSE 趋近于零时,R2R^2 趋近于 1,意味着模型几乎完全拟合数据。

自由度与均方误差

SSE 的自由度等于样本量减去待估参数的个数:nk1n - k - 1,其中 kk 为自变量的个数,常数项截距计入一个参数。利用 SSE 及其自由度,可以计算均方误差(Mean Square Error, MSE):

MSE=SSEnk1\text{MSE} = \frac{\text{SSE}}{n - k - 1}

MSE 是误差项方差 σ2\sigma^2 的无偏估计量,在假设检验和区间估计中具有关键作用。具体而言,回归系数的方差-协方差矩阵可表示为:

Var(β^)=σ2(XX)1\operatorname{Var}(\hat{\boldsymbol{\beta}}) = \sigma^2 (\mathbf{X}'\mathbf{X})^{-1}

实际计算中以 MSE 替代 σ2\sigma^2,从而构造 t 统计量和 F 统计量。

假设检验中的应用

SSE 在假设检验中扮演核心角色。对于回归模型的整体显著性检验(F 检验),检验统计量建立于 SSR 与 SSE 之比之上:

F=SSR/kSSE/(nk1)=MSRMSEF(k,nk1)F = \frac{\text{SSR} / k}{\text{SSE} / (n - k - 1)} = \frac{\text{MSR}}{\text{MSE}} \sim F(k, n - k - 1)

在模型比较中,通过衡量约束模型无约束模型之间 SSE 的增加量,可以构造似然比检验F 检验来判断一组变量的联合显著性。若新增变量能显著减少 SSE,则表明这些变量对因变量具有解释能力。此外,赤池信息量准则(AIC)和贝叶斯信息量准则(BIC)等模型选择指标也间接依赖于 SSE:

AIC=nln(SSEn)+2k,BIC=nln(SSEn)+klnn\text{AIC} = n\ln\left(\frac{\text{SSE}}{n}\right) + 2k, \quad \text{BIC} = n\ln\left(\frac{\text{SSE}}{n}\right) + k\ln n

注意事项

SSE 依赖于数据的量纲——如果因变量的测量单位发生变化,SSE 的数值也会随之改变,因此 SSE 本身不适合直接用于跨模型或跨数据集的比较。此外,在多元回归中加入新的自变量总会使 SSE 下降(或至少不增),这可能导致过度拟合问题。调整 R2R^2 和上述信息准则通过对自由度的惩罚来缓解这一问题。在异常值存在时,个别极端残差的平方项可能主导 SSE,使得模型对异常点过度敏感,此时可考虑使用稳健回归或绝对误差损失函数。