ARTICLE
序列相关
序列相关 (Serial Correlation) 序列相关 (Serial Correlation),在很多情况下也称为 自相关 (Autocorrelation),是时间序列分析和计量经济学中的一个核心概念。它描述了在一个时间序列数据中,一个变量在不同时间点的观测值之间存在的相关性。具体到回归分析的语境中,序列相关通常指模型的误差项(或残差)在不同时间点
序列相关 (Serial Correlation)
序列相关 (Serial Correlation),在很多情况下也称为 自相关 (Autocorrelation),是时间序列分析和计量经济学中的一个核心概念。它描述了在一个时间序列数据中,一个变量在不同时间点的观测值之间存在的相关性。具体到回归分析的语境中,序列相关通常指模型的误差项(或残差)在不同时间点之间不是相互独立的,即一个时期的误差项与其前一个或多个时期的误差项存在相关关系。
序列相关是经典线性回归模型 (Classical Linear Regression Model, CLRM) 的一个重要假设——误差项相互独立(即 for )——被违背的情况。这一违背会给模型的估计和推断带来严重后果。
数学表达与类型
在回归模型 中,序列相关意味着误差项 遵循某种时间依赖模式。最常见的模式是 一阶自回归过程 (First-Order Autoregressive Process),通常表示为 AR(1) 过程:
其中:
- 是在时间点 的误差项。
- 是在前一个时间点 的误差项。
- (rho) 是 自相关系数,它的值介于 -1 和 1 之间 ()。它衡量了相邻误差项之间的相关强度和方向。
- 是一个满足经典回归假设的“白噪声”扰动项,即它具有零均值、恒定方差且自身不存在序列相关。
根据 值的不同,序列相关可以分为:
- 正序列相关 (Positive Serial Correlation): 当 时。这意味着一个正的误差项很可能跟随着另一个正的误差项,一个负的误差项很可能跟随着另一个负的误差项。在图形上,残差会呈现出“聚集”或“粘性”的特征。例如,一个时期的冲击(如未观测到的乐观情绪)可能会持续影响接下来几个时期。这是经济和金融数据中最常见的类型。
- 负序列相关 (Negative Serial Correlation): 当 时。这意味着一个正的误差项很可能跟随着一个负的误差项,反之亦然。在图形上,残差会呈现出频繁地在正负值之间“振荡”的模式。这种情况相对少见,但可能出现在对数据进行过度“差分”处理后。
序列相关产生的原因
序列相关的出现并非偶然,通常由以下几种原因导致:
- 经济变量的惯性 (Inertia): 许多宏观经济变量,如GDP、通货膨胀率或失业率,自身就具有很强的持续性或“惯性”。一个时期的经济冲击(如石油危机或技术革新)其影响往往会延续多个时期,而这种持续性效应如果未被模型中的解释变量完全捕捉,就会残留在误差项中,导致序列相关。
- 模型设定偏误 (Model Misspecification):
- 遗漏重要变量: 如果模型中遗漏了一个或多个重要的解释变量,而被遗漏的变量本身又是序列相关的,那么其影响就会被并入误差项中,从而诱发误差项的序列相关。
- 错误的函数形式: 如果真实的数据生成过程是非线性的(例如,对数关系或二次关系),但研究者错误地设定了一个线性模型,那么残差将会呈现系统性的模式,表现为序列相关。
- 数据处理: 对原始数据进行平滑处理、插值或使用移动平均等方法,都有可能在数据中人为地引入序列相关性。
序列相关的后果
当回归模型中存在序列相关,但研究者仍然使用普通最小二乘法 (Ordinary Least Squares, OLS) 进行估计时,会产生以下严重后果:
- OLS估计量仍然是无偏和一致的: 在满足其他CLRM假设的前提下,即使存在序列相关,OLS 估计出的回归系数()的期望值仍然等于真实的系数值(无偏性),并且当样本量趋于无穷大时,它会收敛于真实值(一致性)。
- OLS估计量不再是有效的 (Not Efficient): OLS估计量不再是最佳线性无偏估计量 (BLUE)。这意味着在所有线性无偏估计量中,OLS估计量的方差不再是最小的。存在其他估计方法(如广义最小二乘法)能够提供更精确(即方差更小)的估计。
- 标准误估计有偏且不一致: 这是最严重的问题。OLS的标准误计算公式是基于“误差项无序列相关”的假设推导的,当此假设不成立时,该公式计算出的标准误是错误的(通常是向下偏误的,尤其是在正序列相关的情况下)。
- 假设检验和置信区间失效: 由于标准误被低估,相应的 统计量 () 会被人为地夸大。这会导致研究者过度拒绝原假设(例如,),从而得出某个变量显著而实际上它可能并不显著的错误结论(犯下第一类错误)。同样,基于错误标准误构建的置信区间也是不可靠的。
序列相关的检验
为了确定模型是否存在序列相关,可以使用以下方法:
- 图示法: 将OLS回归得到的残差 按时间顺序绘制成图。观察图中是否存在明显的模式,如聚集性(正相关)或振荡性(负相关)。这是一种直观但非决定性的方法。
- 杜宾-瓦特森检验 (Durbin-Watson Test, DW Test):
- 这是一个经典的检验方法,专门用于检验一阶序列相关(AR(1))。
- 其统计量为 。
- 的值域为 。一个近似关系是 。
- 判断规则:
- 若 ,则表明没有一阶序列相关。
- 若 趋近于 0,则表明存在正序列相关。
- 若 趋近于 4,则表明存在负序列相关。
- 缺点: 该检验存在两个“不确定区域”,并且不能用于包含滞后因变量作为解释变量的模型中。
- 布罗施-戈弗雷检验 (Breusch-Godfrey Test, BG Test):
- 这是一个更通用、更强大的检验,也称为 LM检验。
- 它可以检验高阶序列相关(AR(p)),并且在模型包含滞后因变量时依然适用。
- 其基本思想是:首先进行OLS回归得到残差 ;然后,将 对所有原始解释变量和滞后的残差()进行辅助回归;最后,基于这个辅助回归的构造一个服从卡方分布的检验统计量。
序列相关的修正方法
一旦检测到序列相关,可以采用以下方法来修正:
- 广义最小二乘法 (Generalized Least Squares, GLS): GLS通过对原始模型进行变换,使得变换后的模型误差项不再有序列相关,然后对变换后的模型使用OLS。其估计量是BLUE。在实践中,由于自相关系数 未知,我们通常使用其估计值 来进行变换,这种方法称为 可行广义最小二乘法 (Feasible Generalized Least Squares, FGLS)。常见的FGLS方法包括Cochrane-Orcutt процедура和Prais-Winsten变换。
- 使用稳健的标准误: 这种方法不改变OLS的系数估计值,而是修正其标准误的计算公式,使其在存在序列相关(以及异方差)的情况下依然是一致的。最著名的方法是 纽维-韦斯特标准误 (Newey-West Standard Errors),也称为 异方差和自相关稳健 (HAC) 标准误。在现代计量经济学实践中,这是一种非常流行和便捷的修正方法。
- 重新设定模型: 考虑到序列相关常常是模型设定偏误的症状,一个根本性的解决方案是重新审视模型设定。例如,加入被遗漏的重要变量,或者改变函数的具体形式。如果模型设定正确,序列相关问题可能自然消失。