ARTICLE
Sum of Squares Regression
Sum of Squares Regression (SSR) Sum of Squares Regression,缩写为 SSR,中文常译为回归平方和,是回归分析与方差分析中度量模型解释力的核心统计量。它量化了因变量 y 的总变异中能够被回归模型(即自变量集合)所解释的部分。在普通最小二乘法 (OLS) 的框架下,SSR 与总平方和 (Total Sum
Sum of Squares Regression (SSR)
Sum of Squares Regression,缩写为 SSR,中文常译为回归平方和,是回归分析与方差分析中度量模型解释力的核心统计量。它量化了因变量 的总变异中能够被回归模型(即自变量集合)所解释的部分。在普通最小二乘法 (OLS) 的框架下,SSR 与总平方和 (Total Sum of Squares, SST) 以及残差平方和 (Sum of Squared Errors, SSE) 共同构成回归分析中最基础的平方和分解恒等式,是推导决定系数 和构造整体显著性F检验的出发点。
需要特别指出的是,缩写 SSR 在统计学文献中存在严重的命名歧义:在某些教材中 SSR 代表 Sum of Squares Regression(回归平方和,即模型的解释部分),而在另一些教材中 SSR 代表 Sum of Squares Residual(残差平方和,即模型的误差部分)。本词条采用前一种约定,将 SSR 定义为回归平方和,与解释平方和 (Explained Sum of Squares, ESS) 或模型平方和 (Model Sum of Squares, MSS) 同义。
数学定义与计算
在一元或多元线性回归模型中,设样本容量为 ,因变量的观测值为 ,其样本均值为 。给定回归模型后,第 个观测的拟合值(预测值)记为 。则回归平方和 SSR 的数学定义为:
其中每一项 度量了回归模型在第 个观测点上相对于朴素均值预测的"改进量"——如果模型完全没有解释力(即所有斜率系数均为零),则 对所有 成立,SSR = 0;如果模型完美拟合,SSR 将趋近于 SST。
在矩阵表示下,记 ,其中 为帽子矩阵,则 SSR 可写作中心化的二次型:
在含截距项的模型中,SSR 的自由度为 ,即自变量的个数(不含截距项)。
平方和分解:回归分析的基石
回归分析中最根本的代数恒等式是方差分解(也称平方和分解):
其中三个核心平方和的含义如下:
- SST (Total Sum of Squares):总平方和,度量因变量围绕其样本均值的总离散程度,自由度为 。它代表了不使用任何自变量信息时数据的总变异量。
- SSR (Sum of Squares Regression):回归平方和,度量模型拟合值 与均值 之间的变异,代表由自变量集合系统性解释的部分,自由度为 。
- SSE (Sum of Squared Errors):残差平方和(也称误差平方和),度量观测值 与拟合值 之间的残差变异,代表模型未能解释的随机成分,自由度为 。
从几何观点看,在 维欧氏空间 中,记 为观测向量, 为均值向量( 为全 1 向量),则残差向量 与拟合值向量 正交(由 OLS 的正规方程保证)。平方和分解本质上就是勾股定理在 中的直接体现:
这一几何直觉不仅优雅,而且揭示了 OLS 估计的本质:回归是将因变量向量向设计矩阵 的列空间做正交投影,SSR 即为投影向量(中心化后)的模长平方。
SSR 与决定系数
回归平方和 SSR 的最直接应用是构造决定系数 (Coefficient of Determination),后者是衡量回归模型拟合优度的标准指标:
利用平方和分解 , 也可等价地表示为:
的值域为 (在含截距项的模型中),其数值直接反映了因变量总变异中被回归模型解释的比例。例如, 意味着因变量 的变异中有 72\% 可归因于自变量的系统性影响,其余 28\% 为模型未能捕捉的残差变异。
值得注意的是,SSR(以及 )具有关于自变量数量的单调非减性:向模型中添加任意新自变量(即使该变量与因变量无关),SSR 不会下降, 不会减小。这是 SSE 的单调非增性的对偶性质。正因为如此,仅凭 或 SSR 的大小进行模型选择会导致过拟合。实践中常使用调整决定系数 (adjusted ),通过自由度惩罚来校正这一偏差:
调整 仅在新增变量对 SSR 的边际贡献超过自由度损失时才会上升,从而为嵌套模型的选择提供了更可靠的准则。
SSR 在 F 检验中的角色
在多元回归分析中,回归平方和是构建整体显著性 F 检验的核心元素。F 检验的原假设 为所有斜率系数同时为零(即模型整体不显著),备择假设 为至少一个斜率系数不为零。检验统计量为回归均方 (Mean Square Regression, MSR) 与残差均方 (Mean Square Error, MSE) 之比:
该统计量在 下服从自由度为 的F分布。F 值的分子 MSR 反映了"平均每个自变量贡献的解释变异",分母 MSE 反映了"平均每个自由度的未解释变异"。若 SSR 相对于 SSE 足够大(经自由度标准化后),F 统计量将显著大于 1,从而提供拒绝 的证据。
更一般地,对于嵌套模型的比较,设约束模型(restricted model)的残差平方和为 ,无约束模型(unrestricted model)的残差平方和为 ,约束条件个数为 。则 F 统计量可写为:
注意到 ,即额外平方和的增量等于回归平方和的增量。因此,任何关于回归系数的线性约束检验最终都可归结为对 SSR 增量的显著性评估。
命名约定与文献差异
SSR 这一缩写在不同教科书和软件中的歧义性是回归分析学习者必须注意的陷阱。常见的三种命名体系如下:
- SSR = Sum of Squares Regression(回归平方和):亦称 ESS (Explained SS) 或 MSS (Model SS)。代表模型解释的变异。这是本词条以及 Wooldridge《Introductory Econometrics》等教材采用的约定。
- SSR = Sum of Squares Residual(残差平方和):亦称 SSE (Sum of Squared Errors) 或 RSS (Residual SS)。代表模型未解释的变异。这是 Stock \& Watson《Introduction to Econometrics》以及 R 语言 \texttt{anova} 输出中的部分用法。
- SSR = Sum of Squares due to Regression:与第一种相同,但用 "due to" 强调因果归因。这是经典统计学教材(如 Neter et al.Applied Linear Statistical Models)的常见用法。
为避免混淆,建议读者始终根据上下文(尤其是平方和分解恒等式)来判断 SSR 的具体含义:若公式为 ,则 SSR 为回归平方和;若公式为 但 SSR 出现在拟合值一侧,则需仔细核对。最安全的做法是使用 ESS(解释平方和)与 RSS(残差平方和)这一对无歧义的缩写。
SSR 与 ANOVA 表的对应
在回归分析的方差分析表 (ANOVA table) 中,SSR 对应"回归"或"模型"行。标准 ANOVA 表的结构如下:
\begin{tabular}{lcccc} 变异来源 \& 平方和 (SS) \& 自由度 (df) \& 均方 (MS) \& F \\ \hline 回归 (Regression) \& SSR \& \& MSR = SSR / \& MSR / MSE \\ 残差 (Error) \& SSE \& \& MSE = SSE / \& — \\ 总计 (Total) \& SST \& \& — \& — \\ \end{tabular}
ANOVA 表将平方和分解、自由度分配、均方计算和 F 检验统一在同一框架中,是回归分析标准输出的核心组成部分。SSR 作为该表的第一行,其大小和显著性直接决定了模型的整体评估结论。
计算实例
考虑一个简单的消费函数回归:以家庭月收入(,千元)解释月消费支出(,千元)。样本数据如下():
算得 ,。OLS 估计得回归方程 。由此计算:
- SST =
- 各点拟合值:
- SSR =
- SSE =
验证平方和分解:,成立。决定系数 ,表明收入解释了消费支出变异的约 92.1\%。F 统计量 ,在 分布下高度显著。
小结
回归平方和 SSR 是回归分析中度量模型解释力的基本统计量,在方差分解、决定系数计算和 F 检验构造中具有不可替代的地位。它与 SST、SSE 共同构成的平方和分解恒等式()是线性模型理论的核心代数结构。正确理解 SSR 的定义、计算和统计含义,是深入学习计量经济学和统计学中回归分析、模型诊断和假设检验的前提。同时,读者应警惕 SSR 缩写在不同教材中的歧义性,始终以平方和分解的具体形式为准来辨别其含义。