ARTICLE

自相关性

自相关性 (Autocorrelation) 自相关性(也称序列相关)是指随机扰动项在时间或空间上存在相关性,即 Cov( _t, _s) 0 ( t s )。在经典线性回归模型中,高斯-马尔可夫定理要求误差项满足球形扰动假设( Var( ) = ^2 I ),自相关的存在意味着该假设被违背:OLS估计量仍满足无偏性和一致性,但不再具有最小方差性(不再BLU

浏览 0 更新 2026-07-15

自相关性 (Autocorrelation)

自相关性(也称序列相关)是指随机扰动项在时间或空间上存在相关性,即 Cov(εt,εs)0 \operatorname{Cov}(\varepsilon_t, \varepsilon_s) \neq 0 ts t \neq s )。在经典线性回归模型中,高斯-马尔可夫定理要求误差项满足球形扰动假设(Var(ε)=σ2I \operatorname{Var}(\boldsymbol{\varepsilon}) = \sigma^2 \mathbf{I} ),自相关的存在意味着该假设被违背:OLS估计量仍满足无偏性和一致性,但不再具有最小方差性(不再BLUE),且标准误和检验统计量不再有效,导致显著性推断出现严重偏误。

数学表述与常见形式

自相关最常以一阶自回归形式建模,即 εt=ρεt1+ut \varepsilon_t = \rho \varepsilon_{t-1} + u_t ρ<1 |\rho| < 1 utWN(0,σu2) u_t \sim \text{WN}(0, \sigma_u^2) )。此时误差项的方差-协方差矩阵为:

Var(ε)=σε2(1ρρ2ρT1ρ1ρρT2ρT1ρT2ρT31)\operatorname{Var}(\boldsymbol{\varepsilon}) = \sigma_\varepsilon^2 \begin{pmatrix} 1 & \rho & \rho^2 & \cdots & \rho^{T-1} \\ \rho & 1 & \rho & \cdots & \rho^{T-2} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ \rho^{T-1} & \rho^{T-2} & \rho^{T-3} & \cdots & 1 \end{pmatrix}

其中每个元素 Cov(εt,εts)=ρsσε2 \operatorname{Cov}(\varepsilon_t, \varepsilon_{t-s}) = \rho^s \sigma_\varepsilon^2 。除了一阶自回归(AR(1))外,还存在移动平均型(MA)自相关和更高阶的自回归结构,但AR(1)在经济时间序列中最为常见。

检测方法

Durbin--Watson (DW) 检验是最常用的自相关检验,统计量为:

DW=t=2T(etet1)2t=1Tet22(1ρ^)\text{DW} = \frac{\sum_{t=2}^T (e_t - e_{t-1})^2}{\sum_{t=1}^T e_t^2} \approx 2(1 - \hat{\rho})

DW值在0到4之间:接近2表明无自相关,趋近0表明正自相关,趋近4表明负自相关。但DW检验有两个关键局限:仅适用于一阶自相关,且要求回归元严格外生(滞后因变量出现时失效)。

Breusch--Godfrey (BG) LM检验克服了这些局限。其构造是:将残差 et e_t 对原始回归元和滞后残差 et1,,etp e_{t-1}, \ldots, e_{t-p} 进行辅助回归,以 TR2 T \cdot R^2 服从 χ2(p) \chi^2(p) 分布进行检验。BG检验可检测高阶自相关,且允许滞后因变量存在。

此外,Ljung--Box Q Q 检验在时间序列建模中广泛使用,偏自相关函数 (PACF) 的截尾模式也为识别自回归阶数提供了直观图形方法。

经济数据中的成因

经济时间序列普遍存在自相关的结构性原因:惯性——GDP、价格指数等宏观变量本身具有持续性,冲击的影响随时间缓慢衰减;模型设定偏误——遗漏了具有自相关结构的解释变量(如消费函数中遗漏财富变量),或错误选择了函数形式;数据加工——插值、季节调整和平滑处理会人为引入或放大序列相关性;蛛网效应——农产品等供给决策滞后导致的周期性波动。在金融领域,交易摩擦、微观结构噪声和市场微观结构效应导致高频收益率呈现序列依赖。

补救方法

若诊断确认自相关存在,有两类处理路径:

  1. 修正标准误Newey--West (1987) 异方差-自相关一致 (HAC) 标准误通过对残差协方差的加权截断(Bartlett核),提供一致的协方差矩阵估计,无需指定自相关具体形式。聚类标准误在面板数据中处理组内序列相关的类似逻辑。
  2. 变换模型:若已知自相关结构,可行广义最小二乘法(FGLS)——如 Cochrane--Orcutt 迭代或 Prais--Winsten 变换——通过准差分 y~t=ytρyt1 \tilde{y}_t = y_t - \rho y_{t-1} 消除序列相关。但FGLS依赖大样本,且要求 ρ \rho 的准确估计。

另一重要思路是动态模型:在解释变量中显式引入滞后因变量 yt1 y_{t-1} 和其他滞后变量,将自相关"吸收"为模型结构的一部分,此时自相关检验转化为模型设定检验。

前沿与应用

在宏观经济学中,理性预期和动态随机一般均衡 (DSGE) 模型对结构残差的序列性质有严格理论约束,自相关诊断可作为模型误设的信号。在金融计量中,波动率聚集性(ARCH/GARCH 类模型)可视为平方误差的自相关现象——收益本身可能不相关,但其二阶矩强相关。在因果推断框架下,差分法 (DiD) 和断点回归 (RDD) 均需处理误差项的序列依赖以有效推断。近年来,稳健推断方法(如随机化推断和自举法)在高维和弱工具变量场景下的自相关处理也成为活跃研究领域。