ARTICLE
Durbin-Watson 统计量
Durbin-Watson 统计量 (Durbin-Watson Statistic) Durbin-Watson 统计量(简称 DW 统计量)是 计量经济学 中用于检测 线性回归模型 的 残差 是否存在 一阶自相关 (First-Order Autocorrelation) 的经典检验统计量。该统计量由 詹姆斯·杜宾 (James Durbin) 和 杰弗
Durbin-Watson 统计量 (Durbin-Watson Statistic)
Durbin-Watson 统计量(简称 DW 统计量)是 计量经济学 中用于检测 线性回归模型 的 残差 是否存在 一阶自相关 (First-Order Autocorrelation) 的经典检验统计量。该统计量由 詹姆斯·杜宾 (James Durbin) 和 杰弗里·沃森 (Geoffrey Watson) 于 1950 年和 1951 年在 Biometrika 期刊上发表的两篇论文中系统提出。自诞生以来,DW 统计量已成为时间序列 回归分析 中最常用的诊断工具之一,几乎所有主流统计软件均将其作为回归诊断的标准输出项。
背景与动机
在 经典线性回归模型 (Classical Linear Regression Model) 的 高斯-马尔可夫定理 (Gauss-Markov Theorem) 假设中,误差项 必须满足 无自相关 (No Autocorrelation) 的条件,即不同观测期的误差项之间不存在 协方差。然而,在 时间序列数据 (Time Series Data) 的应用场景中——如 宏观经济预测、金融收益率 分析以及 政策效应评估——误差项往往呈现出跨期相关特征,即 序列相关 (Serial Correlation)。自相关的存在会带来一系列严重后果:最小二乘估计 (OLS) 虽仍保持 无偏性 (Unbiasedness),但不再具备 有效性 (Efficiency);标准误 估计产生偏差,进而导致 t检验 和 F检验 的推断结论不可靠;最终使 预测区间 和 假设检验 的准确性大幅下降。DW 统计量正是为诊断此类问题而专门设计的检验工具。
统计量的定义与计算
DW 统计量的计算公式建立在回归残差的基础之上。首先对原始模型进行 OLS 估计,获得残差序列 (其中 ),则 DW 统计量的定义为相邻残差差的平方和与残差平方和之比:
将分子展开后,可推导出 DW 统计量与残差的一阶 自相关系数 (Autocorrelation Coefficient) 之间的近似关系:
其中 。这一关系揭示了 DW 统计量的核心解释逻辑:
- 当 (无自相关)时,。
- 当 (正自相关)时,。
- 当 (负自相关)时,。
因此,DW 统计量取值始终在 0 到 4 之间。经验法则认为,DW 值越接近 2,误差项无自相关的可能性越大;DW 值显著小于 2 提示存在正自相关;DW 值显著大于 2 则提示存在负自相关。
检验程序与临界值
DW 检验的特殊之处在于其 临界值 (Critical Value) 的确定方式。由于 DW 统计量的精确分布依赖于 设计矩阵 (Design Matrix) 的具体取值,因此无法给出通用的临界值表。杜宾和沃森为应对这一困难,提出了一个巧妙的解决方案:给出了临界值的 下界 和 上界 ,使得无论设计矩阵的具体形式如何,检验的 显著性水平 都能得到控制。检验的具体操作步骤如下:
- 估计残差:对回归模型进行 OLS 估计,获取残差序列。
- 计算 DW 统计量:依据上述公式计算出 DW 的具体数值。
- 查临界值表:根据 样本量 (Sample Size) 、解释变量 个数 (不含常数项)和预设的显著性水平 ,查 DW 临界值表得到 和 。
- 做出判断:对于检验 (正自相关)的情形: \begin{itemize}
- 若 :拒绝 原假设 ,判定存在正自相关。
- 若 :无法拒绝原假设,认为无正自相关。
- 若 :落入 不确定区 (Inconclusive Region),无法做出明确判断。 \end{itemize}
对于检验负自相关的双侧情况(),只需将 DW 替换为 并重复上述步骤即可。
基本假设与适用条件
DW 统计量在特定条件下方能确保检验的有效性,其基本假设如下:
- 一阶自回归结构:DW 检验专门针对 AR(1) 过程,即 ,其中 为 白噪声 (White Noise)。它无法检测 高阶自相关 (Higher-Order Autocorrelation) 或 移动平均 (MA) 形式的序列相关。
- 含截距项的回归模型:原模型必须包含 截距项 (Intercept),否则 DW 统计量的分布性质将发生改变。
- 无滞后因变量:回归模型的 解释变量 不能包含因变量的滞后项(即不能包含 等 滞后因变量)。若存在滞后因变量,DW 统计量将系统地偏向 2,丧失检验效力,此时应使用 Durbin's h 统计量 (Durbin's h Statistic) 作为替代。
- 严格外生性:解释变量必须是 严格外生 (Strictly Exogenous) 的,即误差项的条件均值为零但不依赖于解释变量序列的全部观测值。
局限性与替代方法
尽管 DW 统计量在计量实践中应用广泛,但其局限性同样不容忽视:
- 不确定区问题:不确定区的存在是 DW 检验最明显的缺陷。在该区域内,研究者无法做出确定的推断结论,使得检验的实际应用价值受到限制。
- 仅限一阶自相关:DW 检验对高阶自相关(如 AR(2)、ARMA 结构等)不具有检验效力。若真实的自相关结构为二阶或更高阶,DW 统计量可能无法识别。
- 无法用于包含滞后因变量的模型:在 动态面板模型 (Dynamic Panel Model) 或 自回归分布滞后模型 (ADL Model) 中,DW 检验不再适用。
- 样本量限制:在小样本情形下,DW 临界值表的准确性可能下降,尤其当样本量小于 15 时检验效力严重不足。
针对上述局限,学者们发展了一系列替代性或补充性的自相关检验方法:
- Durbin's h 统计量:专门用于包含滞后因变量的模型,克服了 DW 统计量在该场景下的失效问题。
- 布罗施-戈弗雷检验 (Breusch-Godfrey Test,又称 LM 检验):这一检验突破了 DW 检验仅限一阶自相关的限制,可检测任意阶数的 序列相关 (Serial Correlation),且同样适用于包含滞后因变量的模型,是 DW 检验最常用的替代方案。
- Ljung–Box Q 检验:广泛用于 ARIMA 模型 残差诊断中,通过检验残差序列的 自相关函数 (ACF) 是否联合为 0 来判断是否存在序列相关,尤其适用于高阶自相关的诊断。
- 自相关函数图 (ACF Plot) 和 偏自相关函数图 (PACF Plot):通过图形化方法直观展示残差序列的自相关结构,常作为 DW 检验的补充诊断工具。
软件实现
DW 统计量的计算在主流统计软件中均已实现为标准化功能。在 R 语言中,\texttt{lmtest} 包的 \texttt{dwtest()} 函数可方便地完成 DW 检验,并输出 DW 值及对应的 p 值;\texttt{car} 包的 \texttt{durbinWatsonTest()} 函数还提供了 自助法 (Bootstrap) p 值的选项,以缓解不确定区问题。在 Stata 中,回归后执行 \texttt{estat dwatson} 命令即可获取 DW 统计量。在 Python 的 \texttt{statsmodels} 库中,\texttt{statsmodels.stats.stattools.durbin\_watson()} 函数可计算 DW 值,而 \texttt{statsmodels.stats.diagnostic.acorr\_durbin\_watson()} 则提供了更完整的检验功能。在 EViews 中,DW 统计量作为回归输出的标准组成部分自动给出。