ARTICLE
Durbin-Watson 检验
Durbin-Watson 检验 (Durbin-Watson Test) Durbin-Watson 检验(简称 DW 检验)是由 詹姆斯·杜宾 (James Durbin) 与 杰弗里·沃森 (Geoffrey Watson) 于1950年和1951年在《生物计量学》(Biometrika) 期刊上相继发表的两篇论文中提出的 统计检验 方法。该检验专门用
Durbin-Watson 检验 (Durbin-Watson Test)
Durbin-Watson 检验(简称 DW 检验)是由 詹姆斯·杜宾 (James Durbin) 与 杰弗里·沃森 (Geoffrey Watson) 于1950年和1951年在《生物计量学》(Biometrika) 期刊上相继发表的两篇论文中提出的 统计检验 方法。该检验专门用于检测 线性回归模型 的 残差 中是否存在 一阶自相关 (First-Order Autocorrelation)。在 计量经济学 和 时间序列分析 中,Durbin-Watson 检验是最经典、应用最广泛的 自相关 诊断工具之一,几乎所有 回归分析 软件都会在输出结果中包含该统计量。
历史与发展
Durbin-Watson 检验的诞生可追溯至1950年代初期,其时 计量经济学 作为独立学科尚处于形成阶段。杜宾和沃森在研究中发现,传统的 假设检验 方法在检测 时间序列 回归残差的自相关时存在诸多不足,尤其是缺乏简单且适用于小样本的精确检验工具。他们开创性地提出了基于残差序列相邻差分的检验统计量,并利用 数值方法 推导出了不同显著性水平下的临界值表。这一研究不仅在方法上具有创新性,而且极大地推动了 回归诊断 技术的发展。杜宾后来在 时间序列分析 和 计量经济学方法 领域继续作出重要贡献,包括提出 Durbin h 检验和 杜宾-吴-豪斯曼检验 (Durbin-Wu-Hausman Test) 等经典方法。
背景与动机
在经典 线性回归模型 中,误差项 的 独立性 是 高斯-马尔可夫定理 (Gauss-Markov Theorem) 的重要假定之一。当误差项之间存在 自相关 时,即 (),虽然 普通最小二乘法 (OLS) 的 估计量 仍保持 无偏性 和 一致性,但不再具有 有效性(即 方差 不再最小),且通常会被低估或高估,进而导致 t检验 和 F检验 的显著性水平失真、置信区间 不可靠。自相关现象在 时间序列数据 中尤为常见,例如 GDP、消费、投资 和 股票价格 等 经济变量 往往呈现出相邻观测值之间的正相关关系。Durbin-Watson 检验正是为诊断这一问题而设计的简便、高效的检验方法。
检验统计量
Durbin-Watson 检验统计量的定义为:
其中 为第 个观测值的 OLS残差, 为样本容量。该统计量度量相邻残差之间差异的平方和与残差平方和之比。通过代数变形可以证明, 统计量与 一阶自相关系数 之间存在近似关系:
其中 为残差的一阶自相关系数。由此可知:
- 当 (无自相关)时,;
- 当 (正自相关)时,;
- 当 (负自相关)时,。
因此, 统计量的取值范围为 ,其值越接近 ,表明残差中不存在一阶自相关的证据越充分。
临界值与判定规则
Durbin-Watson 检验的 临界值 依赖于 样本容量 和 解释变量 个数 (不含截距项)。杜宾和沃森给出了两个临界值:下界 和 上界 。检验的决策规则如下:
对于检验 对立于 (正自相关):
- 若 ,拒绝 ,存在正自相关;
- 若 ,不拒绝 ,无自相关;
- 若 ,落入无结论区 (Inconclusive Region),无法做出判断。
对于负自相关的检验(),使用 替代 后依照上述规则进行判定。对于 双侧检验(),若 或 则拒绝原假设。
基本假定与局限性
Durbin-Watson 检验的有效性依赖于以下 假定:
当回归模型包含 滞后被解释变量(即 作为解释变量)时, 统计量将系统性地偏向 ,导致检验功效严重下降。此时应改用 Durbin h 检验 (Durbin's h Test) 或 布罗施-戈弗雷检验 (Breusch-Godfrey Test) 等替代方法。此外,Durbin-Watson 检验仅检测一阶自相关,对于 高阶自相关(如 AR(2)、季节性 自相关等)不具有检验能力。
应用与延伸
Durbin-Watson 检验在 计量经济学 中具有广泛的应用,是 时间序列回归 模型诊断的标准步骤之一。在 EViews、Stata、R、Python(statsmodels 库)和 SPSS 等主流统计软件中,DW 统计量均作为回归输出的默认组成部分。在 金融经济学 中,资产定价模型 和 事件研究 中常利用该检验检测 市场效率 和 异常收益率 的自相关结构。在 宏观经济学 中,菲利普斯曲线、消费函数 和 投资函数 的估计也常借助 DW 检验评估模型设定是否恰当。
值得注意的是,随着 自助法 (Bootstrap) 和 广义矩估计 (GMM) 等现代方法的普及,异方差自相关一致 (HAC) 标准误的使用已部分替代了对自相关结构的显式检验。然而,Durbin-Watson 检验因其计算简便、直观易懂,依然是 回归诊断 中最具教学意义和实用价值的工具之一。
与相关检验的比较
Durbin-Watson 检验并非唯一可用于检测自相关的工具。布罗施-戈弗雷检验 (Breusch-Godfrey Test) 是 DW 检验的重要推广,它允许检验 高阶自相关,并且不要求回归模型不含 滞后被解释变量,适用性更为广泛。Ljung-Box 检验 (Ljung-Box Test) 则常用于 时间序列模型 的 残差诊断,可同时检验多个滞后阶数的自相关。相较于这些方法,DW 检验的优势在于其简单性和直观的 统计量 解释—— 值直接映射到自相关系数。其劣势则在于仅针对一阶自相关、存在无结论区、以及对模型设定的严格限制。在实际 数据分析 中,研究者通常同时报告 DW 统计量和布罗施-戈弗雷检验的结果,以相互印证。
计算示例
假设某回归模型的样本容量 ,解释变量个数 (不含截距),计算得到 。查 Durbin-Watson 临界值表,在 的显著性水平下,,。由于 ,我们拒绝原假设,判定残差存在一阶正自相关。这意味着模型中可能遗漏了重要的 时间趋势 变量或 动态结构,需要重新考虑模型设定或采用 广义差分法 (Generalized Difference Method) 进行修正。