ARTICLE

杜宾-瓦特森统计量

杜宾-瓦特森统计量 (Durbin-Watson Statistic) 杜宾-瓦特森统计量(Durbin-Watson statistic,简称 DW 统计量)是由 詹姆斯·杜宾(James Durbin)和 杰弗里·瓦特森(Geoffrey Watson)于 1950 年和 1951 年提出的一种用于检测线性回归模型中残差一阶自相关的统计检验。在经典普通最

浏览 4 更新 2025-10-26

杜宾-瓦特森统计量 (Durbin-Watson Statistic)

杜宾-瓦特森统计量(Durbin-Watson statistic,简称 DW 统计量)是由 詹姆斯·杜宾(James Durbin)和 杰弗里·瓦特森(Geoffrey Watson)于 1950 年和 1951 年提出的一种用于检测线性回归模型中残差一阶自相关的统计检验。在经典普通最小二乘法(OLS)的假设中,误差项应相互独立(无自相关)。当这一假设被违背时,OLS 估计量虽然仍保持无偏性和一致性,但不再具有有效性——标准误的估计会产生偏误,导致t检验F检验失效。DW 统计量因此成为时间序列回归诊断中最基础、最广泛使用的工具之一。

自相关问题及其后果

在横截面数据中,观测值之间的独立性通常自然成立;但在时间序列数据中,相邻时期的误差项往往存在相关性。一阶自回归过程(AR(1))是最常见的情形:

ϵt=ρϵt1+ut\epsilon_t = \rho \, \epsilon_{t-1} + u_t

其中 uti.i.d.(0,σ2)u_t \sim \text{i.i.d.}(0, \sigma^2)ρ\rho自相关系数。当 ρ>0\rho > 0 时存在正自相关,扰动项倾向于连续同向;当 ρ<0\rho < 0 时存在负自相关,扰动项倾向于交替反向。正自相关在经济和金融数据中尤为常见。

自相关的后果严重:若忽略自相关而使用 OLS,系数估计量的标准误通常会被低估(在正自相关时),导致 t 统计量膨胀、第一类错误概率上升;同时,基于残差平方和的模型选择准则(如 Rˉ2\bar{R}^2AIC)也会失真。因此,在报告回归结果之前检验自相关的存在至关重要。

DW 统计量的定义与计算

对于样本量为 nn 的回归残差序列 ϵ^1,ϵ^2,,ϵ^n\hat{\epsilon}_1, \hat{\epsilon}_2, \ldots, \hat{\epsilon}_n,DW 统计量定义为:

DW=t=2n(ϵ^tϵ^t1)2t=1nϵ^t2DW = \frac{\sum_{t=2}^{n} (\hat{\epsilon}_t - \hat{\epsilon}_{t-1})^2}{\sum_{t=1}^{n} \hat{\epsilon}_t^2}

统计量的核心直觉简明:分子捕捉相邻残差的一阶差分平方和,分母是残差平方和(用于标准化)。若残差呈正自相关,相邻残差异号的可能性小,差分较小,DW 趋近于 0;若残差呈负自相关,相邻残差频繁交替正负,差分较大,DW 趋近于 4;若无自相关,差分平方和约为残差平方和的两倍,DW 趋近于 2。

DW 与一阶自相关系数 ρ^\hat{\rho} 之间存在近似关系:

DW2(1ρ^)DW \approx 2(1 - \hat{\rho})

ρ^1\hat{\rho} \to 1DW0DW \to 0,当 ρ^1\hat{\rho} \to -1DW4DW \to 4,当 ρ^=0\hat{\rho} = 0DW=2DW = 2。这一近似在小样本下精确度有限,但提供了便捷的直觉框架。

假设检验与杜宾-瓦特森表

DW 检验的原假设为 H0:ρ=0H_0: \rho = 0(无一阶自相关),备择假设可以是单侧(H1:ρ>0H_1: \rho > 0H1:ρ<0H_1: \rho < 0)或双侧(H1:ρ0H_1: \rho \neq 0)。

DW 统计量的精确分布依赖于设计矩阵 X\mathbf{X},因此无法给出一个单一的临界值。杜宾和瓦特森提出了一个巧妙的解决方案:为 DW 统计量构造上界 dUd_U下界 dLd_L,这两个界限仅依赖于样本量 nn、解释变量个数 kk(不含截距项)和显著性水平 α\alpha,而与具体的 X\mathbf{X} 无关。

检验决策规则(以 ρ>0\rho > 0 为例):

  • DW<dLDW < d_L:拒绝 H0H_0,存在显著正自相关。
  • DW>dUDW > d_U:不拒绝 H0H_0,无显著正自相关。
  • dLDWdUd_L \leq DW \leq d_U:落入无结论区(inconclusive zone),无法确定。

对于负自相关的检验,利用对称性计算 4DW4-DW,然后按相同规则判断。若 4DW<dL4-DW < d_L,则拒绝 H0H_0 存在显著负自相关;若 4DW>dU4-DW > d_U,则不拒绝。

无结论区的存在是 DW 检验的主要局限之一。当统计量落入此区域时,无法做出明确判断,需要借助其他检验方法(如Breusch-Godfrey检验Ljung-Box Q检验)或收集更多数据。

DW 检验的前提假设与适用条件

DW 检验并非普适工具,其有效性依赖以下条件:

  1. 回归模型必须包含截距项:若无截距,残差的构造方式不同,DW 的分布性质不再成立。
  2. 解释变量必须是非随机的(或在重复抽样中固定):这排除了包含滞后因变量作为解释变量的模型。在自回归模型中(例如 yt=α+βyt1+ϵty_t = \alpha + \beta y_{t-1} + \epsilon_t),DW 统计量会偏向 2,即倾向于错误地不拒绝无自相关的原假设。此时应使用杜宾h统计量(Durbin's h test)。
  3. 误差项服从正态分布:这是 DW 分布推导的前提,虽然许多应用中对这一假设的偏离并不致命。
  4. 仅适用于一阶自相关:DW 检验设计的对立假设是 AR(1) 过程,对于高阶自相关(如 AR(p),p>1p > 1),DW 的检验功效大打折扣。Breusch-Godfrey LM检验(也称序列相关 LM 检验)是更为通用(可检验 AR(p))的替代方案。
  5. 样本量不能过小:当 nn 很小时,DW 的分布严重偏离正态近似,上下界表的覆盖范围有限。

扩展与替代检验

杜宾 h 统计量专为包含滞后因变量的模型设计。考虑 yt=α+βyt1+γxt+ϵty_t = \alpha + \beta y_{t-1} + \gamma x_t + \epsilon_t,h 统计量定义为:

h=ρ^n1nVar^(β^)h = \hat{\rho} \sqrt{\frac{n}{1 - n \cdot \widehat{\text{Var}}(\hat{\beta})}}

其中 ρ^\hat{\rho} 可根据 DW 近似 ρ^1DW/2\hat{\rho} \approx 1 - DW/2 获得。在大样本下,hN(0,1)h \sim \mathcal{N}(0, 1),可直接使用标准正态临界值。

Breusch-Godfrey 检验(BG 检验)是更现代的替代方法。它通过将残差对其滞后值及原始解释变量进行辅助回归来构造 LM 统计量,可同时检验任意阶自相关,且允许滞后因变量存在。由于其灵活性和更高的功效,BG 检验在当代实证研究中日益取代 DW 成为首选。

在实证研究中的应用

DW 统计量在经济学、金融学和社会科学的实证研究中广泛应用。研究者通常在回归结果表格末尾报告 DW 值,使读者能快速判断模型是否受到自相关的困扰。经验法则上,DW 值在 1.5 到 2.5 之间通常被视为可接受范围;低于 1.0 或高于 3.0 则需要严肃对待。

如果 DW 检验拒绝了无自相关的原假设,研究者可采取以下补救措施:使用广义最小二乘法(GLS)进行Cochrane-Orcutt迭代Prais-Winsten变换估计;采用异方差与自相关一致标准误(HAC,即Newey-West标准误)进行稳健推断;或重新审视模型设定——有时显著的 DW 值暗示的不是纯粹的自相关,而是模型设定偏误,如遗漏了关键的滞后变量或采用了错误的函数形式

计算示例

考虑一个包含 30 个观测值和 2 个解释变量(不含截距)的回归模型,残差平方和 ϵ^t2=120\sum \hat{\epsilon}_t^2 = 120,相邻残差差的平方和 (ϵ^tϵ^t1)2=60\sum (\hat{\epsilon}_t - \hat{\epsilon}_{t-1})^2 = 60。则:

DW=60120=0.5DW = \frac{60}{120} = 0.5

查杜宾-瓦特森表,n=30,k=2,α=0.05n=30, k=2, \alpha=0.05dL1.28,dU1.57d_L \approx 1.28, d_U \approx 1.57。因为 DW=0.5<dL=1.28DW=0.5 < d_L=1.28,拒绝无自相关的原假设,判断存在显著正自相关。这一发现提示研究者需对标准误进行修正,或采用考虑自相关结构的估计方法。

DW 统计量以其简洁的公式、直观的含义和广泛的适用性,成为计量经济学教学与实践中不可或缺的诊断工具。尽管存在无结论区和仅能检测一阶自相关等局限,但作为回归诊断的第一步筛查,其价值历久弥新。