ARTICLE

Durbin-Watson 检验

Durbin-Watson 检验 (Durbin-Watson Test) Durbin-Watson 检验（简称 DW 检验）是由詹姆斯·杜宾 (James Durbin) 与杰弗里·沃森 (Geoffrey Watson) 于1950年和1951年在《生物计量学》(Biometrika) 期刊上相继发表的两篇论文中提出的统计检验方法。该检验专门用

浏览 0 更新 2026-07-11

Durbin-Watson 检验 (Durbin-Watson Test)

Durbin-Watson 检验（简称 DW 检验）是由詹姆斯·杜宾 (James Durbin) 与杰弗里·沃森 (Geoffrey Watson) 于1950年和1951年在《生物计量学》(Biometrika) 期刊上相继发表的两篇论文中提出的统计检验方法。该检验专门用于检测线性回归模型的残差中是否存在 一阶自相关 (First-Order Autocorrelation)。在计量经济学和时间序列分析中，Durbin-Watson 检验是最经典、应用最广泛的自相关诊断工具之一，几乎所有回归分析软件都会在输出结果中包含该统计量。

历史与发展

Durbin-Watson 检验的诞生可追溯至1950年代初期，其时计量经济学作为独立学科尚处于形成阶段。杜宾和沃森在研究中发现，传统的假设检验方法在检测时间序列回归残差的自相关时存在诸多不足，尤其是缺乏简单且适用于小样本的精确检验工具。他们开创性地提出了基于残差序列相邻差分的检验统计量，并利用数值方法推导出了不同显著性水平下的临界值表。这一研究不仅在方法上具有创新性，而且极大地推动了回归诊断技术的发展。杜宾后来在时间序列分析和计量经济学方法领域继续作出重要贡献，包括提出 Durbin h 检验和杜宾-吴-豪斯曼检验 (Durbin-Wu-Hausman Test) 等经典方法。

背景与动机

在经典线性回归模型中，误差项的独立性是高斯-马尔可夫定理 (Gauss-Markov Theorem) 的重要假定之一。当误差项之间存在自相关时，即 $\operatorname{Cov}(\varepsilon_i, \varepsilon_j) \neq 0$ （ $i \neq j$ ），虽然普通最小二乘法 (OLS) 的估计量仍保持无偏性和一致性，但不再具有有效性（即方差不再最小），且通常会被低估或高估，进而导致 t检验和 F检验的显著性水平失真、置信区间不可靠。自相关现象在时间序列数据中尤为常见，例如 GDP、消费、投资和股票价格等经济变量往往呈现出相邻观测值之间的正相关关系。Durbin-Watson 检验正是为诊断这一问题而设计的简便、高效的检验方法。

检验统计量

Durbin-Watson 检验统计量的定义为：

d = \frac{\sum_{t=2}^{T} (e_t - e_{t-1})^2}{\sum_{t=1}^{T} e_t^2}

其中 $e_t$ 为第 $t$ 个观测值的 OLS残差， $T$ 为样本容量。该统计量度量相邻残差之间差异的平方和与残差平方和之比。通过代数变形可以证明， $d$ 统计量与一阶自相关系数 $\hat{\rho}$ 之间存在近似关系：

d \approx 2(1 - \hat{\rho})

其中 $\hat{\rho} = \frac{\sum_{t=2}^{T} e_t e_{t-1}}{\sum_{t=1}^{T} e_t^2}$ 为残差的一阶自相关系数。由此可知：

当 $\hat{\rho} \approx 0$ （无自相关）时， $d \approx 2$ ；
当 $\hat{\rho} \approx 1$ （正自相关）时， $d \approx 0$ ；
当 $\hat{\rho} \approx -1$ （负自相关）时， $d \approx 4$ 。

因此， $d$ 统计量的取值范围为 $[0, 4]$ ，其值越接近 $2$ ，表明残差中不存在一阶自相关的证据越充分。

临界值与判定规则

Durbin-Watson 检验的临界值依赖于样本容量 $T$ 和解释变量个数 $k$ （不含截距项）。杜宾和沃森给出了两个临界值：下界 $d_L$ 和上界 $d_U$ 。检验的决策规则如下：

对于检验 $H_0: \rho = 0$ 对立于 $H_1: \rho > 0$ （正自相关）：

若 $d < d_L$ ，拒绝 $H_0$ ，存在正自相关；
若 $d > d_U$ ，不拒绝 $H_0$ ，无自相关；
若 $d_L \leq d \leq d_U$ ，落入无结论区 (Inconclusive Region)，无法做出判断。

对于负自相关的检验（ $H_1: \rho < 0$ ），使用 $4 - d$ 替代 $d$ 后依照上述规则进行判定。对于双侧检验（ $H_1: \rho \neq 0$ ），若 $d < d_L$ 或 $d > 4 - d_L$ 则拒绝原假设。

基本假定与局限性

Durbin-Watson 检验的有效性依赖于以下假定：

回归模型包含截距项；
自相关结构为 一阶自回归过程 AR(1)，即 $\varepsilon_t = \rho \varepsilon_{t-1} + u_t$ ；
回归模型中不包含被解释变量的 滞后项 作为解释变量；
误差项服从正态分布。

当回归模型包含滞后被解释变量（即 $y_{t-1}$ 作为解释变量）时， $d$ 统计量将系统性地偏向 $2$ ，导致检验功效严重下降。此时应改用 Durbin h 检验 (Durbin's h Test) 或 布罗施-戈弗雷检验 (Breusch-Godfrey Test) 等替代方法。此外，Durbin-Watson 检验仅检测一阶自相关，对于 高阶自相关（如 AR(2)、季节性自相关等）不具有检验能力。

应用与延伸

Durbin-Watson 检验在计量经济学中具有广泛的应用，是时间序列回归模型诊断的标准步骤之一。在 EViews、Stata、R、Python（statsmodels 库）和 SPSS 等主流统计软件中，DW 统计量均作为回归输出的默认组成部分。在金融经济学中，资产定价模型和事件研究中常利用该检验检测市场效率和异常收益率的自相关结构。在宏观经济学中，菲利普斯曲线、消费函数和投资函数的估计也常借助 DW 检验评估模型设定是否恰当。

值得注意的是，随着自助法 (Bootstrap) 和广义矩估计 (GMM) 等现代方法的普及，异方差自相关一致 (HAC) 标准误的使用已部分替代了对自相关结构的显式检验。然而，Durbin-Watson 检验因其计算简便、直观易懂，依然是回归诊断中最具教学意义和实用价值的工具之一。

与相关检验的比较

Durbin-Watson 检验并非唯一可用于检测自相关的工具。布罗施-戈弗雷检验 (Breusch-Godfrey Test) 是 DW 检验的重要推广，它允许检验高阶自相关，并且不要求回归模型不含滞后被解释变量，适用性更为广泛。Ljung-Box 检验 (Ljung-Box Test) 则常用于时间序列模型的残差诊断，可同时检验多个滞后阶数的自相关。相较于这些方法，DW 检验的优势在于其简单性和直观的统计量解释—— $d$ 值直接映射到自相关系数。其劣势则在于仅针对一阶自相关、存在无结论区、以及对模型设定的严格限制。在实际数据分析中，研究者通常同时报告 DW 统计量和布罗施-戈弗雷检验的结果，以相互印证。

计算示例

假设某回归模型的样本容量 $T = 50$ ，解释变量个数 $k = 3$ （不含截距），计算得到 $d = 1.12$ 。查 Durbin-Watson 临界值表，在 $\alpha = 0.05$ 的显著性水平下， $d_L = 1.38$ ， $d_U = 1.60$ 。由于 $d = 1.12 < d_L = 1.38$ ，我们拒绝原假设，判定残差存在一阶正自相关。这意味着模型中可能遗漏了重要的时间趋势变量或动态结构，需要重新考虑模型设定或采用广义差分法 (Generalized Difference Method) 进行修正。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。