ARTICLE

Durbin-Watson 统计量

Durbin-Watson 统计量 (Durbin-Watson Statistic) Durbin-Watson 统计量(简称 DW 统计量)是 计量经济学 中用于检测 线性回归模型 的 残差 是否存在 一阶自相关 (First-Order Autocorrelation) 的经典检验统计量。该统计量由 詹姆斯·杜宾 (James Durbin) 和 杰弗

浏览 0 更新 2026-07-11

Durbin-Watson 统计量 (Durbin-Watson Statistic)

Durbin-Watson 统计量(简称 DW 统计量)是 计量经济学 中用于检测 线性回归模型残差 是否存在 一阶自相关 (First-Order Autocorrelation) 的经典检验统计量。该统计量由 詹姆斯·杜宾 (James Durbin) 和 杰弗里·沃森 (Geoffrey Watson) 于 1950 年和 1951 年在 Biometrika 期刊上发表的两篇论文中系统提出。自诞生以来,DW 统计量已成为时间序列 回归分析 中最常用的诊断工具之一,几乎所有主流统计软件均将其作为回归诊断的标准输出项。

背景与动机

经典线性回归模型 (Classical Linear Regression Model) 的 高斯-马尔可夫定理 (Gauss-Markov Theorem) 假设中,误差项 必须满足 无自相关 (No Autocorrelation) 的条件,即不同观测期的误差项之间不存在 协方差。然而,在 时间序列数据 (Time Series Data) 的应用场景中——如 宏观经济预测金融收益率 分析以及 政策效应评估——误差项往往呈现出跨期相关特征,即 序列相关 (Serial Correlation)。自相关的存在会带来一系列严重后果:最小二乘估计 (OLS) 虽仍保持 无偏性 (Unbiasedness),但不再具备 有效性 (Efficiency);标准误 估计产生偏差,进而导致 t检验F检验 的推断结论不可靠;最终使 预测区间假设检验 的准确性大幅下降。DW 统计量正是为诊断此类问题而专门设计的检验工具。

统计量的定义与计算

DW 统计量的计算公式建立在回归残差的基础之上。首先对原始模型进行 OLS 估计,获得残差序列 ε^t\hat{\varepsilon}_t(其中 t=1,2,,Tt = 1, 2, \ldots, T),则 DW 统计量的定义为相邻残差差的平方和与残差平方和之比:

DW=t=2T(ε^tε^t1)2t=1Tε^t2\text{DW} = \frac{\sum_{t=2}^T (\hat{\varepsilon}_t - \hat{\varepsilon}_{t-1})^2}{\sum_{t=1}^T \hat{\varepsilon}_t^2}

将分子展开后,可推导出 DW 统计量与残差的一阶 自相关系数 (Autocorrelation Coefficient) ρ^\hat{\rho} 之间的近似关系:

DW2(1ρ^)\text{DW} \approx 2(1 - \hat{\rho})

其中 ρ^=t=2Tε^tε^t1t=1Tε^t2\hat{\rho} = \frac{\sum_{t=2}^T \hat{\varepsilon}_t \hat{\varepsilon}_{t-1}}{\sum_{t=1}^T \hat{\varepsilon}_t^2}。这一关系揭示了 DW 统计量的核心解释逻辑:

  • ρ^0\hat{\rho} \approx 0(无自相关)时,DW2\text{DW} \approx 2
  • ρ^1\hat{\rho} \approx 1(正自相关)时,DW0\text{DW} \approx 0
  • ρ^1\hat{\rho} \approx -1(负自相关)时,DW4\text{DW} \approx 4

因此,DW 统计量取值始终在 0 到 4 之间。经验法则认为,DW 值越接近 2,误差项无自相关的可能性越大;DW 值显著小于 2 提示存在正自相关;DW 值显著大于 2 则提示存在负自相关。

检验程序与临界值

DW 检验的特殊之处在于其 临界值 (Critical Value) 的确定方式。由于 DW 统计量的精确分布依赖于 设计矩阵 (Design Matrix) XX 的具体取值,因此无法给出通用的临界值表。杜宾和沃森为应对这一困难,提出了一个巧妙的解决方案:给出了临界值的 下界 dLd_L上界 dUd_U,使得无论设计矩阵的具体形式如何,检验的 显著性水平 都能得到控制。检验的具体操作步骤如下:

  1. 估计残差:对回归模型进行 OLS 估计,获取残差序列。
  2. 计算 DW 统计量:依据上述公式计算出 DW 的具体数值。
  3. 查临界值表:根据 样本量 (Sample Size) TT解释变量 个数 kk(不含常数项)和预设的显著性水平 α\alpha,查 DW 临界值表得到 dLd_LdUd_U
  4. 做出判断:对于检验 ρ>0\rho > 0(正自相关)的情形: \begin{itemize}
  5. DW<dL\text{DW} < d_L:拒绝 原假设 H0:ρ=0H_0: \rho = 0,判定存在正自相关。
  6. DW>dU\text{DW} > d_U:无法拒绝原假设,认为无正自相关。
  7. dLDWdUd_L \leq \text{DW} \leq d_U:落入 不确定区 (Inconclusive Region),无法做出明确判断。 \end{itemize}

对于检验负自相关的双侧情况(ρ0\rho \neq 0),只需将 DW 替换为 4DW4 - \text{DW} 并重复上述步骤即可。

基本假设与适用条件

DW 统计量在特定条件下方能确保检验的有效性,其基本假设如下:

  • 一阶自回归结构:DW 检验专门针对 AR(1) 过程,即 εt=ρεt1+ut\varepsilon_t = \rho \varepsilon_{t-1} + u_t,其中 utu_t白噪声 (White Noise)。它无法检测 高阶自相关 (Higher-Order Autocorrelation) 或 移动平均 (MA) 形式的序列相关。
  • 含截距项的回归模型:原模型必须包含 截距项 (Intercept),否则 DW 统计量的分布性质将发生改变。
  • 无滞后因变量:回归模型的 解释变量 不能包含因变量的滞后项(即不能包含 yt1y_{t-1}滞后因变量)。若存在滞后因变量,DW 统计量将系统地偏向 2,丧失检验效力,此时应使用 Durbin's h 统计量 (Durbin's h Statistic) 作为替代。
  • 严格外生性:解释变量必须是 严格外生 (Strictly Exogenous) 的,即误差项的条件均值为零但不依赖于解释变量序列的全部观测值。

局限性与替代方法

尽管 DW 统计量在计量实践中应用广泛,但其局限性同样不容忽视:

  • 不确定区问题:不确定区的存在是 DW 检验最明显的缺陷。在该区域内,研究者无法做出确定的推断结论,使得检验的实际应用价值受到限制。
  • 仅限一阶自相关:DW 检验对高阶自相关(如 AR(2)、ARMA 结构等)不具有检验效力。若真实的自相关结构为二阶或更高阶,DW 统计量可能无法识别。
  • 无法用于包含滞后因变量的模型:在 动态面板模型 (Dynamic Panel Model) 或 自回归分布滞后模型 (ADL Model) 中,DW 检验不再适用。
  • 样本量限制:在小样本情形下,DW 临界值表的准确性可能下降,尤其当样本量小于 15 时检验效力严重不足。

针对上述局限,学者们发展了一系列替代性或补充性的自相关检验方法:

  1. Durbin's h 统计量:专门用于包含滞后因变量的模型,克服了 DW 统计量在该场景下的失效问题。
  2. 布罗施-戈弗雷检验 (Breusch-Godfrey Test,又称 LM 检验):这一检验突破了 DW 检验仅限一阶自相关的限制,可检测任意阶数的 序列相关 (Serial Correlation),且同样适用于包含滞后因变量的模型,是 DW 检验最常用的替代方案。
  3. Ljung–Box Q 检验:广泛用于 ARIMA 模型 残差诊断中,通过检验残差序列的 自相关函数 (ACF) 是否联合为 0 来判断是否存在序列相关,尤其适用于高阶自相关的诊断。
  4. 自相关函数图 (ACF Plot) 和 偏自相关函数图 (PACF Plot):通过图形化方法直观展示残差序列的自相关结构,常作为 DW 检验的补充诊断工具。

软件实现

DW 统计量的计算在主流统计软件中均已实现为标准化功能。在 R 语言中,\texttt{lmtest} 包的 \texttt{dwtest()} 函数可方便地完成 DW 检验,并输出 DW 值及对应的 p 值;\texttt{car} 包的 \texttt{durbinWatsonTest()} 函数还提供了 自助法 (Bootstrap) p 值的选项,以缓解不确定区问题。在 Stata 中,回归后执行 \texttt{estat dwatson} 命令即可获取 DW 统计量。在 Python 的 \texttt{statsmodels} 库中,\texttt{statsmodels.stats.stattools.durbin\_watson()} 函数可计算 DW 值,而 \texttt{statsmodels.stats.diagnostic.acorr\_durbin\_watson()} 则提供了更完整的检验功能。在 EViews 中,DW 统计量作为回归输出的标准组成部分自动给出。