ARTICLE

杜宾-瓦特森统计量

杜宾-瓦特森统计量 (Durbin-Watson Statistic) 杜宾-瓦特森统计量（Durbin-Watson statistic，简称 DW 统计量）是由詹姆斯·杜宾（James Durbin）和杰弗里·瓦特森（Geoffrey Watson）于 1950 年和 1951 年提出的一种用于检测线性回归模型中残差一阶自相关的统计检验。在经典普通最

浏览 4 更新 2025-10-26

杜宾-瓦特森统计量 (Durbin-Watson Statistic)

杜宾-瓦特森统计量（Durbin-Watson statistic，简称 DW 统计量）是由詹姆斯·杜宾（James Durbin）和杰弗里·瓦特森（Geoffrey Watson）于 1950 年和 1951 年提出的一种用于检测线性回归模型中残差一阶自相关的统计检验。在经典普通最小二乘法（OLS）的假设中，误差项应相互独立（无自相关）。当这一假设被违背时，OLS 估计量虽然仍保持无偏性和一致性，但不再具有有效性——标准误的估计会产生偏误，导致t检验和F检验失效。DW 统计量因此成为时间序列回归诊断中最基础、最广泛使用的工具之一。

自相关问题及其后果

在横截面数据中，观测值之间的独立性通常自然成立；但在时间序列数据中，相邻时期的误差项往往存在相关性。一阶自回归过程（AR(1)）是最常见的情形：

\epsilon_t = \rho \, \epsilon_{t-1} + u_t

其中 $u_t \sim \text{i.i.d.}(0, \sigma^2)$ ， $\rho$ 为自相关系数。当 $\rho > 0$ 时存在正自相关，扰动项倾向于连续同向；当 $\rho < 0$ 时存在负自相关，扰动项倾向于交替反向。正自相关在经济和金融数据中尤为常见。

自相关的后果严重：若忽略自相关而使用 OLS，系数估计量的标准误通常会被低估（在正自相关时），导致 t 统计量膨胀、第一类错误概率上升；同时，基于残差平方和的模型选择准则（如 $\bar{R}^2$ 、AIC）也会失真。因此，在报告回归结果之前检验自相关的存在至关重要。

DW 统计量的定义与计算

对于样本量为 $n$ 的回归残差序列 $\hat{\epsilon}_1, \hat{\epsilon}_2, \ldots, \hat{\epsilon}_n$ ，DW 统计量定义为：

DW = \frac{\sum_{t=2}^{n} (\hat{\epsilon}_t - \hat{\epsilon}_{t-1})^2}{\sum_{t=1}^{n} \hat{\epsilon}_t^2}

统计量的核心直觉简明：分子捕捉相邻残差的一阶差分平方和，分母是残差平方和（用于标准化）。若残差呈正自相关，相邻残差异号的可能性小，差分较小，DW 趋近于 0；若残差呈负自相关，相邻残差频繁交替正负，差分较大，DW 趋近于 4；若无自相关，差分平方和约为残差平方和的两倍，DW 趋近于 2。

DW 与一阶自相关系数 $\hat{\rho}$ 之间存在近似关系：

DW \approx 2(1 - \hat{\rho})

当 $\hat{\rho} \to 1$ 时 $DW \to 0$ ，当 $\hat{\rho} \to -1$ 时 $DW \to 4$ ，当 $\hat{\rho} = 0$ 时 $DW = 2$ 。这一近似在小样本下精确度有限，但提供了便捷的直觉框架。

假设检验与杜宾-瓦特森表

DW 检验的原假设为 $H_0: \rho = 0$ （无一阶自相关），备择假设可以是单侧（ $H_1: \rho > 0$ 或 $H_1: \rho < 0$ ）或双侧（ $H_1: \rho \neq 0$ ）。

DW 统计量的精确分布依赖于设计矩阵 $\mathbf{X}$ ，因此无法给出一个单一的临界值。杜宾和瓦特森提出了一个巧妙的解决方案：为 DW 统计量构造上界 $d_U$ 和下界 $d_L$ ，这两个界限仅依赖于样本量 $n$ 、解释变量个数 $k$ （不含截距项）和显著性水平 $\alpha$ ，而与具体的 $\mathbf{X}$ 无关。

检验决策规则（以 $\rho > 0$ 为例）：

若 $DW < d_L$ ：拒绝 $H_0$ ，存在显著正自相关。
若 $DW > d_U$ ：不拒绝 $H_0$ ，无显著正自相关。
若 $d_L \leq DW \leq d_U$ ：落入无结论区（inconclusive zone），无法确定。

对于负自相关的检验，利用对称性计算 $4-DW$ ，然后按相同规则判断。若 $4-DW < d_L$ ，则拒绝 $H_0$ 存在显著负自相关；若 $4-DW > d_U$ ，则不拒绝。

无结论区的存在是 DW 检验的主要局限之一。当统计量落入此区域时，无法做出明确判断，需要借助其他检验方法（如Breusch-Godfrey检验或Ljung-Box Q检验）或收集更多数据。

DW 检验的前提假设与适用条件

DW 检验并非普适工具，其有效性依赖以下条件：

回归模型必须包含截距项：若无截距，残差的构造方式不同，DW 的分布性质不再成立。
解释变量必须是非随机的（或在重复抽样中固定）：这排除了包含滞后因变量作为解释变量的模型。在自回归模型中（例如 $y_t = \alpha + \beta y_{t-1} + \epsilon_t$ ），DW 统计量会偏向 2，即倾向于错误地不拒绝无自相关的原假设。此时应使用杜宾h统计量（Durbin's h test）。
误差项服从正态分布：这是 DW 分布推导的前提，虽然许多应用中对这一假设的偏离并不致命。
仅适用于一阶自相关：DW 检验设计的对立假设是 AR(1) 过程，对于高阶自相关（如 AR(p)， $p > 1$ ），DW 的检验功效大打折扣。Breusch-Godfrey LM检验（也称序列相关 LM 检验）是更为通用（可检验 AR(p)）的替代方案。
样本量不能过小：当 $n$ 很小时，DW 的分布严重偏离正态近似，上下界表的覆盖范围有限。

扩展与替代检验

杜宾 h 统计量专为包含滞后因变量的模型设计。考虑 $y_t = \alpha + \beta y_{t-1} + \gamma x_t + \epsilon_t$ ，h 统计量定义为：

h = \hat{\rho} \sqrt{\frac{n}{1 - n \cdot \widehat{\text{Var}}(\hat{\beta})}}

其中 $\hat{\rho}$ 可根据 DW 近似 $\hat{\rho} \approx 1 - DW/2$ 获得。在大样本下， $h \sim \mathcal{N}(0, 1)$ ，可直接使用标准正态临界值。

Breusch-Godfrey 检验（BG 检验）是更现代的替代方法。它通过将残差对其滞后值及原始解释变量进行辅助回归来构造 LM 统计量，可同时检验任意阶自相关，且允许滞后因变量存在。由于其灵活性和更高的功效，BG 检验在当代实证研究中日益取代 DW 成为首选。

在实证研究中的应用

DW 统计量在经济学、金融学和社会科学的实证研究中广泛应用。研究者通常在回归结果表格末尾报告 DW 值，使读者能快速判断模型是否受到自相关的困扰。经验法则上，DW 值在 1.5 到 2.5 之间通常被视为可接受范围；低于 1.0 或高于 3.0 则需要严肃对待。

如果 DW 检验拒绝了无自相关的原假设，研究者可采取以下补救措施：使用广义最小二乘法（GLS）进行Cochrane-Orcutt迭代或Prais-Winsten变换估计；采用异方差与自相关一致标准误（HAC，即Newey-West标准误）进行稳健推断；或重新审视模型设定——有时显著的 DW 值暗示的不是纯粹的自相关，而是模型设定偏误，如遗漏了关键的滞后变量或采用了错误的函数形式。

计算示例

考虑一个包含 30 个观测值和 2 个解释变量（不含截距）的回归模型，残差平方和 $\sum \hat{\epsilon}_t^2 = 120$ ，相邻残差差的平方和 $\sum (\hat{\epsilon}_t - \hat{\epsilon}_{t-1})^2 = 60$ 。则：

DW = \frac{60}{120} = 0.5

查杜宾-瓦特森表， $n=30, k=2, \alpha=0.05$ 时 $d_L \approx 1.28, d_U \approx 1.57$ 。因为 $DW=0.5 < d_L=1.28$ ，拒绝无自相关的原假设，判断存在显著正自相关。这一发现提示研究者需对标准误进行修正，或采用考虑自相关结构的估计方法。

DW 统计量以其简洁的公式、直观的含义和广泛的适用性，成为计量经济学教学与实践中不可或缺的诊断工具。尽管存在无结论区和仅能检测一阶自相关等局限，但作为回归诊断的第一步筛查，其价值历久弥新。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。