ARTICLE

Durbin-Watson 检验

Durbin-Watson 检验 (Durbin-Watson Test) Durbin-Watson 检验(简称 DW 检验)是由 詹姆斯·杜宾 (James Durbin) 与 杰弗里·沃森 (Geoffrey Watson) 于1950年和1951年在《生物计量学》(Biometrika) 期刊上相继发表的两篇论文中提出的 统计检验 方法。该检验专门用

浏览 0 更新 2026-07-11

Durbin-Watson 检验 (Durbin-Watson Test)

Durbin-Watson 检验(简称 DW 检验)是由 詹姆斯·杜宾 (James Durbin) 与 杰弗里·沃森 (Geoffrey Watson) 于1950年和1951年在《生物计量学》(Biometrika) 期刊上相继发表的两篇论文中提出的 统计检验 方法。该检验专门用于检测 线性回归模型残差 中是否存在 一阶自相关 (First-Order Autocorrelation)。在 计量经济学时间序列分析 中,Durbin-Watson 检验是最经典、应用最广泛的 自相关 诊断工具之一,几乎所有 回归分析 软件都会在输出结果中包含该统计量。

历史与发展

Durbin-Watson 检验的诞生可追溯至1950年代初期,其时 计量经济学 作为独立学科尚处于形成阶段。杜宾和沃森在研究中发现,传统的 假设检验 方法在检测 时间序列 回归残差的自相关时存在诸多不足,尤其是缺乏简单且适用于小样本的精确检验工具。他们开创性地提出了基于残差序列相邻差分的检验统计量,并利用 数值方法 推导出了不同显著性水平下的临界值表。这一研究不仅在方法上具有创新性,而且极大地推动了 回归诊断 技术的发展。杜宾后来在 时间序列分析计量经济学方法 领域继续作出重要贡献,包括提出 Durbin h 检验和 杜宾-吴-豪斯曼检验 (Durbin-Wu-Hausman Test) 等经典方法。

背景与动机

在经典 线性回归模型 中,误差项独立性高斯-马尔可夫定理 (Gauss-Markov Theorem) 的重要假定之一。当误差项之间存在 自相关 时,即 Cov(εi,εj)0 \operatorname{Cov}(\varepsilon_i, \varepsilon_j) \neq 0 ij i \neq j ),虽然 普通最小二乘法 (OLS) 的 估计量 仍保持 无偏性一致性,但不再具有 有效性(即 方差 不再最小),且通常会被低估或高估,进而导致 t检验F检验 的显著性水平失真、置信区间 不可靠。自相关现象在 时间序列数据 中尤为常见,例如 GDP消费投资股票价格经济变量 往往呈现出相邻观测值之间的正相关关系。Durbin-Watson 检验正是为诊断这一问题而设计的简便、高效的检验方法。

检验统计量

Durbin-Watson 检验统计量的定义为:

d=t=2T(etet1)2t=1Tet2d = \frac{\sum_{t=2}^{T} (e_t - e_{t-1})^2}{\sum_{t=1}^{T} e_t^2}

其中 et e_t 为第 t t 个观测值的 OLS残差T T 为样本容量。该统计量度量相邻残差之间差异的平方和与残差平方和之比。通过代数变形可以证明,d d 统计量与 一阶自相关系数 ρ^ \hat{\rho} 之间存在近似关系:

d2(1ρ^)d \approx 2(1 - \hat{\rho})

其中 ρ^=t=2Tetet1t=1Tet2 \hat{\rho} = \frac{\sum_{t=2}^{T} e_t e_{t-1}}{\sum_{t=1}^{T} e_t^2} 为残差的一阶自相关系数。由此可知:

  • ρ^0 \hat{\rho} \approx 0 (无自相关)时,d2 d \approx 2
  • ρ^1 \hat{\rho} \approx 1 (正自相关)时,d0 d \approx 0
  • ρ^1 \hat{\rho} \approx -1 (负自相关)时,d4 d \approx 4

因此,d d 统计量的取值范围为 [0,4] [0, 4] ,其值越接近 2 2 ,表明残差中不存在一阶自相关的证据越充分。

临界值与判定规则

Durbin-Watson 检验的 临界值 依赖于 样本容量 T T 解释变量 个数 k k (不含截距项)。杜宾和沃森给出了两个临界值:下界 dL d_L 上界 dU d_U 。检验的决策规则如下:

对于检验 H0:ρ=0 H_0: \rho = 0 对立于 H1:ρ>0 H_1: \rho > 0 (正自相关):

  • d<dL d < d_L ,拒绝 H0 H_0 ,存在正自相关;
  • d>dU d > d_U ,不拒绝 H0 H_0 ,无自相关;
  • dLddU d_L \leq d \leq d_U ,落入无结论区 (Inconclusive Region),无法做出判断。

对于负自相关的检验(H1:ρ<0 H_1: \rho < 0 ),使用 4d 4 - d 替代 d d 后依照上述规则进行判定。对于 双侧检验H1:ρ0 H_1: \rho \neq 0 ),若 d<dL d < d_L d>4dL d > 4 - d_L 则拒绝原假设。

基本假定与局限性

Durbin-Watson 检验的有效性依赖于以下 假定

  • 回归模型包含 截距项
  • 自相关结构为 一阶自回归过程 AR(1),即 εt=ρεt1+ut \varepsilon_t = \rho \varepsilon_{t-1} + u_t
  • 回归模型中不包含 被解释变量滞后项 作为解释变量;
  • 误差项服从 正态分布

当回归模型包含 滞后被解释变量(即 yt1 y_{t-1} 作为解释变量)时,d d 统计量将系统性地偏向 2 2 ,导致检验功效严重下降。此时应改用 Durbin h 检验 (Durbin's h Test) 或 布罗施-戈弗雷检验 (Breusch-Godfrey Test) 等替代方法。此外,Durbin-Watson 检验仅检测一阶自相关,对于 高阶自相关(如 AR(2)、季节性 自相关等)不具有检验能力。

应用与延伸

Durbin-Watson 检验在 计量经济学 中具有广泛的应用,是 时间序列回归 模型诊断的标准步骤之一。在 EViewsStataRPython(statsmodels 库)和 SPSS 等主流统计软件中,DW 统计量均作为回归输出的默认组成部分。在 金融经济学 中,资产定价模型事件研究 中常利用该检验检测 市场效率异常收益率 的自相关结构。在 宏观经济学 中,菲利普斯曲线消费函数投资函数 的估计也常借助 DW 检验评估模型设定是否恰当。

值得注意的是,随着 自助法 (Bootstrap) 和 广义矩估计 (GMM) 等现代方法的普及,异方差自相关一致 (HAC) 标准误的使用已部分替代了对自相关结构的显式检验。然而,Durbin-Watson 检验因其计算简便、直观易懂,依然是 回归诊断 中最具教学意义和实用价值的工具之一。

与相关检验的比较

Durbin-Watson 检验并非唯一可用于检测自相关的工具。布罗施-戈弗雷检验 (Breusch-Godfrey Test) 是 DW 检验的重要推广,它允许检验 高阶自相关,并且不要求回归模型不含 滞后被解释变量,适用性更为广泛。Ljung-Box 检验 (Ljung-Box Test) 则常用于 时间序列模型残差诊断,可同时检验多个滞后阶数的自相关。相较于这些方法,DW 检验的优势在于其简单性和直观的 统计量 解释——d d 值直接映射到自相关系数。其劣势则在于仅针对一阶自相关、存在无结论区、以及对模型设定的严格限制。在实际 数据分析 中,研究者通常同时报告 DW 统计量和布罗施-戈弗雷检验的结果,以相互印证。

计算示例

假设某回归模型的样本容量 T=50 T = 50 ,解释变量个数 k=3 k = 3 (不含截距),计算得到 d=1.12 d = 1.12 。查 Durbin-Watson 临界值表,在 α=0.05 \alpha = 0.05 的显著性水平下,dL=1.38 d_L = 1.38 dU=1.60 d_U = 1.60 。由于 d=1.12<dL=1.38 d = 1.12 < d_L = 1.38 ,我们拒绝原假设,判定残差存在一阶正自相关。这意味着模型中可能遗漏了重要的 时间趋势 变量或 动态结构,需要重新考虑模型设定或采用 广义差分法 (Generalized Difference Method) 进行修正。