ARTICLE

R平方 ($R^2$)

R平方（公式，又称决定系数）是统计学和回归分析中衡量模型拟合优度的核心指标，表示自变量对因变量变异的解释比例。其取值范围为公式，值越接近1，说明模型对数据的拟合程度越高。作为回归分析中最为广泛使用的诊断统计量之一，公式不仅用于评价模型的预测能力，也在经济学、金融学、生物统计学、社会科学等众多实证研究领域中发挥着不可或缺的作用。 1. 定义与数学表

浏览 0 更新 2025-11-10

R平方（ $R^2$ ，又称决定系数）是统计学和回归分析中衡量模型拟合优度的核心指标，表示自变量对因变量变异的解释比例。其取值范围为 $[0,1]$ ，值越接近1，说明模型对数据的拟合程度越高。作为回归分析中最为广泛使用的诊断统计量之一， $R^2$ 不仅用于评价模型的预测能力，也在经济学、金融学、生物统计学、社会科学等众多实证研究领域中发挥着不可或缺的作用。

1. 定义与数学表达

1.1 基本定义

在线性回归模型中， $R^2$ 定义为回归平方和（SSR，即模型解释的变异）与总平方和（SST，即因变量的总变异）之比：

R^2 = \frac{SSR}{SST} = 1 - \frac{SSE}{SST}

其中，SSE为残差平方和（模型未能解释的变异）。具体而言：

总平方和（SST）： $\sum_{i=1}^{n}(y_i - \bar{y})^2$ ，衡量因变量的总变异程度；
回归平方和（SSR）： $\sum_{i=1}^{n}(\hat{y}_i - \bar{y})^2$ ，衡量模型预测值相对于均值的偏离；
残差平方和（SSE）： $\sum_{i=1}^{n}(y_i - \hat{y}_i)^2$ ，衡量实际值与预测值之间的偏差。

三者满足关系： $SST = SSR + SSE$ 。因此 $R^2$ 的本质是模型所"捕捉"到的变异占总变异的比例。

1.2 与相关系数的关系

在简单线性回归（仅包含一个自变量）的情况下， $R^2$ 恰好等于自变量 $x$ 与因变量 $y$ 之间皮尔逊相关系数 $r$ 的平方：

R^2 = r^2

这意味着 $R^2$ 不仅衡量了模型的拟合优度，也间接反映了两个变量之间线性关系的强度。然而，这一等价关系在多元回归中不再成立——多元回归中的 $R^2$ 是多个自变量与因变量之间复合相关性的平方。

2. 调整R平方与模型的局限性

2.1 调整R平方

普通 $R^2$ 存在一个内在缺陷：当在模型中增加额外的自变量时，即使该变量与因变量毫无关系， $R^2$ 也绝不会下降——至少会保持不变，通常还会略微上升。这一特性源于最小二乘法的数学性质，它鼓励研究者不加甄别地加入更多变量，从而产生过度拟合（overfitting）的风险。

为解决这一问题，统计学家提出了调整R平方（Adjusted $R^2$ ）的概念：

\bar{R}^2 = 1 - \frac{SSE/(n-k-1)}{SST/(n-1)} = 1 - (1-R^2)\frac{n-1}{n-k-1}

其中 $n$ 为样本量， $k$ 为自变量个数。调整 $R^2$ 通过引入惩罚项来纠正自变量数量对 $R^2$ 的虚高影响。其数值通常小于普通 $R^2$ ，且有可能为负值。在模型选择中，研究者常使用调整 $R^2$ 来比较包含不同自变量个数的模型。

2.2 $R^2$ 的局限性

$R^2$ 虽被广泛使用，但存在若干重要的局限性。第一， $R^2$ 不能衡量模型的因果解释力。即使 $R^2$ 接近0.9，也不意味着自变量对因变量有因果关系，可能仅仅反映了遗漏变量、反向因果或虚假相关。第二，高 $R^2$ 不能保证预测准确性。在包含趋势或季节性的时间序列数据中，即使模型的 $R^2$ 极高，样本外的预测能力也可能非常糟糕。第三， $R^2$ 对异常值高度敏感。一个极端观测点即可大幅改变 $R^2$ 的数值。第四， $R^2$ 不能用于比较不同因变量或不同变换形式下的模型，因为在因变量经过对数变换或其他非线性变换后，SST 的尺度发生了改变， $R^2$ 不具有直接可比性。

3. $R^2$ 在各类模型中的适用性

3.1 非线性模型中的伪R平方

对于广义线性模型（如Logistic回归、泊松回归等），由于不再有 $SST = SSR + SSE$ 的恒等关系，传统的 $R^2$ 定义无法直接使用。因此，统计学家发展了一系列伪R平方（Pseudo- $R^2$ ）指标，包括McFadden's $R^2$ 、Cox \& Snell $R^2$ 和 Nagelkerke $R^2$ 等。这些指标试图在非线性框架下近似地衡量模型的解释能力，但不同伪 $R^2$ 的数值含义差异较大，且其解释通常不如线性回归中的 $R^2$ 直观。

3.2 样本外R平方

在金融经济学和机器学习中，研究者越来越关注模型的样本外预测能力，因而引入了样本外 $R^2$ （Out-of-sample $R^2$ ）的概念。其计算方式为比较预测模型的均方预测误差（MSPE）与简单历史均值的均方预测误差，反映模型相对于朴素基准的预测增益。著名的Campbell-Thompson样本外 $R^2$ 统计量即为这一思想的具体体现，常用于检验股票收益率的可预测性。

3.3 时间序列中的R平方

在时间序列回归中， $R^2$ 需要谨慎解读。如果因变量和自变量都包含较强的趋势成分，则回归得出的 $R^2$ 可能被人为抬高。这便是所谓的虚假回归（Spurious Regression）问题——两个独立随机游走序列之间也可能产生很高的 $R^2$ 。因此，在使用时间序列数据时，研究者通常先对变量进行差分或去趋势处理，再评估 $R^2$ 的实际意义。

4. 实践中的解读指南

4.1 何为"高"R平方？

$R^2$ 多高才算"好"取决于学科背景和研究目的。在纯自然科学（如物理实验）中， $R^2$ 达到0.99以上并不罕见；在社会科学中，由于人类行为的复杂性， $R^2$ 在0.2到0.4之间即被视为具有相当的解释力；在金融学中，日度股票收益率的 $R^2$ 往往低于0.05。因此，脱离具体领域判断 $R^2$ 的高低是没有意义的。

4.2 $R^2$ 与模型选择策略

在实证研究中，研究者应当注意以下原则：切勿仅凭 $R^2$ 选择模型——高 $R^2$ 可能来自过度拟合而非真正的解释力；优先使用调整 $R^2$ 或信息准则（AIC、BIC）进行模型比较；结合残差诊断（如正态性、异方差性、自相关性）综合评估模型质量；在预测任务中，应使用交叉验证或样本外测试来评估模型的实际泛化能力。 $R^2$ 作为回归分析最直观的拟合指标，只有在其适用条件和局限性被充分理解的前提下，才能成为有效的数据分析工具。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。