ARTICLE

序列相关

序列相关 (Serial Correlation) 序列相关 (Serial Correlation)，在很多情况下也称为自相关 (Autocorrelation)，是时间序列分析和计量经济学中的一个核心概念。它描述了在一个时间序列数据中，一个变量在不同时间点的观测值之间存在的相关性。具体到回归分析的语境中，序列相关通常指模型的误差项（或残差）在不同时间点

浏览 69 更新 2025-10-26

序列相关 (Serial Correlation)

序列相关 (Serial Correlation)，在很多情况下也称为 自相关 (Autocorrelation)，是时间序列分析和计量经济学中的一个核心概念。它描述了在一个时间序列数据中，一个变量在不同时间点的观测值之间存在的相关性。具体到回归分析的语境中，序列相关通常指模型的误差项（或残差）在不同时间点之间不是相互独立的，即一个时期的误差项与其前一个或多个时期的误差项存在相关关系。

序列相关是经典线性回归模型 (Classical Linear Regression Model, CLRM) 的一个重要假设——误差项相互独立（即 $Cov(\epsilon_t, \epsilon_s) = 0$ for $t \neq s$ ）——被违背的情况。这一违背会给模型的估计和推断带来严重后果。

数学表达与类型

在回归模型 $Y_t = \beta_0 + \beta_1 X_t + \epsilon_t$ 中，序列相关意味着误差项 $\epsilon_t$ 遵循某种时间依赖模式。最常见的模式是 一阶自回归过程 (First-Order Autoregressive Process)，通常表示为 AR(1) 过程：

\epsilon_t = \rho \epsilon_{t-1} + u_t

其中：

$\epsilon_t$ 是在时间点 $t$ 的误差项。
$\epsilon_{t-1}$ 是在前一个时间点 $t-1$ 的误差项。
$\rho$ (rho) 是 自相关系数，它的值介于 -1 和 1 之间 ( $-1 < \rho < 1$ )。它衡量了相邻误差项之间的相关强度和方向。
$u_t$ 是一个满足经典回归假设的“白噪声”扰动项，即它具有零均值、恒定方差且自身不存在序列相关。

根据 $\rho$ 值的不同，序列相关可以分为：

正序列相关 (Positive Serial Correlation): 当 $\rho > 0$ 时。这意味着一个正的误差项很可能跟随着另一个正的误差项，一个负的误差项很可能跟随着另一个负的误差项。在图形上，残差会呈现出“聚集”或“粘性”的特征。例如，一个时期的冲击（如未观测到的乐观情绪）可能会持续影响接下来几个时期。这是经济和金融数据中最常见的类型。

负序列相关 (Negative Serial Correlation): 当 $\rho < 0$ 时。这意味着一个正的误差项很可能跟随着一个负的误差项，反之亦然。在图形上，残差会呈现出频繁地在正负值之间“振荡”的模式。这种情况相对少见，但可能出现在对数据进行过度“差分”处理后。

序列相关产生的原因

序列相关的出现并非偶然，通常由以下几种原因导致：

经济变量的惯性 (Inertia): 许多宏观经济变量，如GDP、通货膨胀率或失业率，自身就具有很强的持续性或“惯性”。一个时期的经济冲击（如石油危机或技术革新）其影响往往会延续多个时期，而这种持续性效应如果未被模型中的解释变量完全捕捉，就会残留在误差项中，导致序列相关。

模型设定偏误 (Model Misspecification):

遗漏重要变量: 如果模型中遗漏了一个或多个重要的解释变量，而被遗漏的变量本身又是序列相关的，那么其影响就会被并入误差项中，从而诱发误差项的序列相关。
错误的函数形式: 如果真实的数据生成过程是非线性的（例如，对数关系或二次关系），但研究者错误地设定了一个线性模型，那么残差将会呈现系统性的模式，表现为序列相关。

数据处理: 对原始数据进行平滑处理、插值或使用移动平均等方法，都有可能在数据中人为地引入序列相关性。

序列相关的后果

当回归模型中存在序列相关，但研究者仍然使用普通最小二乘法 (Ordinary Least Squares, OLS) 进行估计时，会产生以下严重后果：

OLS估计量仍然是无偏和一致的: 在满足其他CLRM假设的前提下，即使存在序列相关，OLS 估计出的回归系数（ $\hat{\beta}$ ）的期望值仍然等于真实的系数值（无偏性），并且当样本量趋于无穷大时，它会收敛于真实值（一致性）。

OLS估计量不再是有效的 (Not Efficient): OLS估计量不再是最佳线性无偏估计量 (BLUE)。这意味着在所有线性无偏估计量中，OLS估计量的方差不再是最小的。存在其他估计方法（如广义最小二乘法）能够提供更精确（即方差更小）的估计。

标准误估计有偏且不一致: 这是最严重的问题。OLS的标准误计算公式是基于“误差项无序列相关”的假设推导的，当此假设不成立时，该公式计算出的标准误是错误的（通常是向下偏误的，尤其是在正序列相关的情况下）。

假设检验和置信区间失效: 由于标准误被低估，相应的 $t$ 统计量 ( $t = \hat{\beta} / se(\hat{\beta})$ ) 会被人为地夸大。这会导致研究者过度拒绝原假设（例如， $H_0: \beta_1 = 0$ ），从而得出某个变量显著而实际上它可能并不显著的错误结论（犯下第一类错误)。同样，基于错误标准误构建的置信区间也是不可靠的。

序列相关的检验

为了确定模型是否存在序列相关，可以使用以下方法：

图示法: 将OLS回归得到的残差 $\hat{\epsilon}_t$ 按时间顺序绘制成图。观察图中是否存在明显的模式，如聚集性（正相关）或振荡性（负相关）。这是一种直观但非决定性的方法。

杜宾-瓦特森检验 (Durbin-Watson Test, DW Test):

这是一个经典的检验方法，专门用于检验一阶序列相关（AR(1)）。
其统计量为 $DW = \frac{\sum_{t=2}^{T}(\hat{\epsilon}_t - \hat{\epsilon}_{t-1})^2}{\sum_{t=1}^{T}\hat{\epsilon}_t^2}$ 。
$DW$ 的值域为 $[0, 4]$ 。一个近似关系是 $DW \approx 2(1 - \hat{\rho})$ 。
判断规则:
若 $DW \approx 2$ ，则表明没有一阶序列相关。
若 $DW$ 趋近于 0，则表明存在正序列相关。
若 $DW$ 趋近于 4，则表明存在负序列相关。
缺点: 该检验存在两个“不确定区域”，并且不能用于包含滞后因变量作为解释变量的模型中。

布罗施-戈弗雷检验 (Breusch-Godfrey Test, BG Test):

这是一个更通用、更强大的检验，也称为 LM检验。
它可以检验高阶序列相关（AR(p)），并且在模型包含滞后因变量时依然适用。
其基本思想是：首先进行OLS回归得到残差 $\hat{\epsilon}_t$ ；然后，将 $\hat{\epsilon}_t$ 对所有原始解释变量和滞后的残差（ $\hat{\epsilon}_{t-1}, \ldots , \hat{\epsilon}_{t-p}$ ）进行辅助回归；最后，基于这个辅助回归的 $R^2$ 构造一个服从卡方分布的检验统计量。

序列相关的修正方法

一旦检测到序列相关，可以采用以下方法来修正：

广义最小二乘法 (Generalized Least Squares, GLS): GLS通过对原始模型进行变换，使得变换后的模型误差项不再有序列相关，然后对变换后的模型使用OLS。其估计量是BLUE。在实践中，由于自相关系数 $\rho$ 未知，我们通常使用其估计值 $\hat{\rho}$ 来进行变换，这种方法称为 可行广义最小二乘法 (Feasible Generalized Least Squares, FGLS)。常见的FGLS方法包括Cochrane-Orcutt процедура和Prais-Winsten变换。

使用稳健的标准误: 这种方法不改变OLS的系数估计值，而是修正其标准误的计算公式，使其在存在序列相关（以及异方差）的情况下依然是一致的。最著名的方法是 纽维-韦斯特标准误 (Newey-West Standard Errors)，也称为 异方差和自相关稳健 (HAC) 标准误。在现代计量经济学实践中，这是一种非常流行和便捷的修正方法。

重新设定模型: 考虑到序列相关常常是模型设定偏误的症状，一个根本性的解决方案是重新审视模型设定。例如，加入被遗漏的重要变量，或者改变函数的具体形式。如果模型设定正确，序列相关问题可能自然消失。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。