ARTICLE

Durbin-Watson 统计量

Durbin-Watson 统计量 (Durbin-Watson Statistic) Durbin-Watson 统计量（简称 DW 统计量）是计量经济学中用于检测线性回归模型的残差是否存在一阶自相关 (First-Order Autocorrelation) 的经典检验统计量。该统计量由詹姆斯·杜宾 (James Durbin) 和杰弗

浏览 0 更新 2026-07-11

Durbin-Watson 统计量 (Durbin-Watson Statistic)

Durbin-Watson 统计量（简称 DW 统计量）是计量经济学中用于检测线性回归模型的残差是否存在 一阶自相关 (First-Order Autocorrelation) 的经典检验统计量。该统计量由詹姆斯·杜宾 (James Durbin) 和杰弗里·沃森 (Geoffrey Watson) 于 1950 年和 1951 年在 Biometrika 期刊上发表的两篇论文中系统提出。自诞生以来，DW 统计量已成为时间序列回归分析中最常用的诊断工具之一，几乎所有主流统计软件均将其作为回归诊断的标准输出项。

背景与动机

在经典线性回归模型 (Classical Linear Regression Model) 的高斯-马尔可夫定理 (Gauss-Markov Theorem) 假设中，误差项必须满足 无自相关 (No Autocorrelation) 的条件，即不同观测期的误差项之间不存在协方差。然而，在时间序列数据 (Time Series Data) 的应用场景中——如宏观经济预测、金融收益率分析以及政策效应评估——误差项往往呈现出跨期相关特征，即 序列相关 (Serial Correlation)。自相关的存在会带来一系列严重后果：最小二乘估计 (OLS) 虽仍保持无偏性 (Unbiasedness)，但不再具备有效性 (Efficiency)；标准误估计产生偏差，进而导致 t检验和 F检验的推断结论不可靠；最终使预测区间和假设检验的准确性大幅下降。DW 统计量正是为诊断此类问题而专门设计的检验工具。

统计量的定义与计算

DW 统计量的计算公式建立在回归残差的基础之上。首先对原始模型进行 OLS 估计，获得残差序列 $\hat{\varepsilon}_t$ （其中 $t = 1, 2, \ldots, T$ ），则 DW 统计量的定义为相邻残差差的平方和与残差平方和之比：

\text{DW} = \frac{\sum_{t=2}^T (\hat{\varepsilon}_t - \hat{\varepsilon}_{t-1})^2}{\sum_{t=1}^T \hat{\varepsilon}_t^2}

将分子展开后，可推导出 DW 统计量与残差的一阶自相关系数 (Autocorrelation Coefficient) $\hat{\rho}$ 之间的近似关系：

\text{DW} \approx 2(1 - \hat{\rho})

其中 $\hat{\rho} = \frac{\sum_{t=2}^T \hat{\varepsilon}_t \hat{\varepsilon}_{t-1}}{\sum_{t=1}^T \hat{\varepsilon}_t^2}$ 。这一关系揭示了 DW 统计量的核心解释逻辑：

当 $\hat{\rho} \approx 0$ （无自相关）时， $\text{DW} \approx 2$ 。
当 $\hat{\rho} \approx 1$ （正自相关）时， $\text{DW} \approx 0$ 。
当 $\hat{\rho} \approx -1$ （负自相关）时， $\text{DW} \approx 4$ 。

因此，DW 统计量取值始终在 0 到 4 之间。经验法则认为，DW 值越接近 2，误差项无自相关的可能性越大；DW 值显著小于 2 提示存在正自相关；DW 值显著大于 2 则提示存在负自相关。

检验程序与临界值

DW 检验的特殊之处在于其 临界值 (Critical Value) 的确定方式。由于 DW 统计量的精确分布依赖于设计矩阵 (Design Matrix) $X$ 的具体取值，因此无法给出通用的临界值表。杜宾和沃森为应对这一困难，提出了一个巧妙的解决方案：给出了临界值的下界 $d_L$ 和上界 $d_U$ ，使得无论设计矩阵的具体形式如何，检验的显著性水平都能得到控制。检验的具体操作步骤如下：

估计残差：对回归模型进行 OLS 估计，获取残差序列。
计算 DW 统计量：依据上述公式计算出 DW 的具体数值。
查临界值表：根据样本量 (Sample Size) $T$ 、解释变量个数 $k$ （不含常数项）和预设的显著性水平 $\alpha$ ，查 DW 临界值表得到 $d_L$ 和 $d_U$ 。
做出判断：对于检验 $\rho > 0$ （正自相关）的情形： \begin{itemize}
若 $\text{DW} < d_L$ ：拒绝原假设 $H_0: \rho = 0$ ，判定存在正自相关。
若 $\text{DW} > d_U$ ：无法拒绝原假设，认为无正自相关。
若 $d_L \leq \text{DW} \leq d_U$ ：落入 不确定区 (Inconclusive Region)，无法做出明确判断。 \end{itemize}

对于检验负自相关的双侧情况（ $\rho \neq 0$ ），只需将 DW 替换为 $4 - \text{DW}$ 并重复上述步骤即可。

基本假设与适用条件

DW 统计量在特定条件下方能确保检验的有效性，其基本假设如下：

一阶自回归结构：DW 检验专门针对 AR(1) 过程，即 $\varepsilon_t = \rho \varepsilon_{t-1} + u_t$ ，其中 $u_t$ 为白噪声 (White Noise)。它无法检测高阶自相关 (Higher-Order Autocorrelation) 或移动平均 (MA) 形式的序列相关。
含截距项的回归模型：原模型必须包含截距项 (Intercept)，否则 DW 统计量的分布性质将发生改变。
无滞后因变量：回归模型的解释变量不能包含因变量的滞后项（即不能包含 $y_{t-1}$ 等滞后因变量）。若存在滞后因变量，DW 统计量将系统地偏向 2，丧失检验效力，此时应使用 Durbin's h 统计量 (Durbin's h Statistic) 作为替代。
严格外生性：解释变量必须是 严格外生 (Strictly Exogenous) 的，即误差项的条件均值为零但不依赖于解释变量序列的全部观测值。

局限性与替代方法

尽管 DW 统计量在计量实践中应用广泛，但其局限性同样不容忽视：

不确定区问题：不确定区的存在是 DW 检验最明显的缺陷。在该区域内，研究者无法做出确定的推断结论，使得检验的实际应用价值受到限制。
仅限一阶自相关：DW 检验对高阶自相关（如 AR(2)、ARMA 结构等）不具有检验效力。若真实的自相关结构为二阶或更高阶，DW 统计量可能无法识别。
无法用于包含滞后因变量的模型：在动态面板模型 (Dynamic Panel Model) 或自回归分布滞后模型 (ADL Model) 中，DW 检验不再适用。
样本量限制：在小样本情形下，DW 临界值表的准确性可能下降，尤其当样本量小于 15 时检验效力严重不足。

针对上述局限，学者们发展了一系列替代性或补充性的自相关检验方法：

Durbin's h 统计量：专门用于包含滞后因变量的模型，克服了 DW 统计量在该场景下的失效问题。
布罗施-戈弗雷检验 (Breusch-Godfrey Test，又称 LM 检验)：这一检验突破了 DW 检验仅限一阶自相关的限制，可检测任意阶数的序列相关 (Serial Correlation)，且同样适用于包含滞后因变量的模型，是 DW 检验最常用的替代方案。
Ljung–Box Q 检验：广泛用于 ARIMA 模型残差诊断中，通过检验残差序列的自相关函数 (ACF) 是否联合为 0 来判断是否存在序列相关，尤其适用于高阶自相关的诊断。
自相关函数图 (ACF Plot) 和偏自相关函数图 (PACF Plot)：通过图形化方法直观展示残差序列的自相关结构，常作为 DW 检验的补充诊断工具。

软件实现

DW 统计量的计算在主流统计软件中均已实现为标准化功能。在 R 语言中，\texttt{lmtest} 包的 \texttt{dwtest()} 函数可方便地完成 DW 检验，并输出 DW 值及对应的 p 值；\texttt{car} 包的 \texttt{durbinWatsonTest()} 函数还提供了自助法 (Bootstrap) p 值的选项，以缓解不确定区问题。在 Stata 中，回归后执行 \texttt{estat dwatson} 命令即可获取 DW 统计量。在 Python 的 \texttt{statsmodels} 库中，\texttt{statsmodels.stats.stattools.durbin\_watson()} 函数可计算 DW 值，而 \texttt{statsmodels.stats.diagnostic.acorr\_durbin\_watson()} 则提供了更完整的检验功能。在 EViews 中，DW 统计量作为回归输出的标准组成部分自动给出。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。