ARTICLE
杜宾-瓦特森统计量
杜宾-瓦特森统计量 (Durbin-Watson Statistic) 杜宾-瓦特森统计量(Durbin-Watson statistic,简称 DW 统计量)是由 詹姆斯·杜宾(James Durbin)和 杰弗里·瓦特森(Geoffrey Watson)于 1950 年和 1951 年提出的一种用于检测线性回归模型中残差一阶自相关的统计检验。在经典普通最
杜宾-瓦特森统计量 (Durbin-Watson Statistic)
杜宾-瓦特森统计量(Durbin-Watson statistic,简称 DW 统计量)是由 詹姆斯·杜宾(James Durbin)和 杰弗里·瓦特森(Geoffrey Watson)于 1950 年和 1951 年提出的一种用于检测线性回归模型中残差一阶自相关的统计检验。在经典普通最小二乘法(OLS)的假设中,误差项应相互独立(无自相关)。当这一假设被违背时,OLS 估计量虽然仍保持无偏性和一致性,但不再具有有效性——标准误的估计会产生偏误,导致t检验和F检验失效。DW 统计量因此成为时间序列回归诊断中最基础、最广泛使用的工具之一。
自相关问题及其后果
在横截面数据中,观测值之间的独立性通常自然成立;但在时间序列数据中,相邻时期的误差项往往存在相关性。一阶自回归过程(AR(1))是最常见的情形:
其中 , 为自相关系数。当 时存在正自相关,扰动项倾向于连续同向;当 时存在负自相关,扰动项倾向于交替反向。正自相关在经济和金融数据中尤为常见。
自相关的后果严重:若忽略自相关而使用 OLS,系数估计量的标准误通常会被低估(在正自相关时),导致 t 统计量膨胀、第一类错误概率上升;同时,基于残差平方和的模型选择准则(如 、AIC)也会失真。因此,在报告回归结果之前检验自相关的存在至关重要。
DW 统计量的定义与计算
对于样本量为 的回归残差序列 ,DW 统计量定义为:
统计量的核心直觉简明:分子捕捉相邻残差的一阶差分平方和,分母是残差平方和(用于标准化)。若残差呈正自相关,相邻残差异号的可能性小,差分较小,DW 趋近于 0;若残差呈负自相关,相邻残差频繁交替正负,差分较大,DW 趋近于 4;若无自相关,差分平方和约为残差平方和的两倍,DW 趋近于 2。
DW 与一阶自相关系数 之间存在近似关系:
当 时 ,当 时 ,当 时 。这一近似在小样本下精确度有限,但提供了便捷的直觉框架。
假设检验与杜宾-瓦特森表
DW 检验的原假设为 (无一阶自相关),备择假设可以是单侧( 或 )或双侧()。
DW 统计量的精确分布依赖于设计矩阵 ,因此无法给出一个单一的临界值。杜宾和瓦特森提出了一个巧妙的解决方案:为 DW 统计量构造上界 和下界 ,这两个界限仅依赖于样本量 、解释变量个数 (不含截距项)和显著性水平 ,而与具体的 无关。
检验决策规则(以 为例):
- 若 :拒绝 ,存在显著正自相关。
- 若 :不拒绝 ,无显著正自相关。
- 若 :落入无结论区(inconclusive zone),无法确定。
对于负自相关的检验,利用对称性计算 ,然后按相同规则判断。若 ,则拒绝 存在显著负自相关;若 ,则不拒绝。
无结论区的存在是 DW 检验的主要局限之一。当统计量落入此区域时,无法做出明确判断,需要借助其他检验方法(如Breusch-Godfrey检验或Ljung-Box Q检验)或收集更多数据。
DW 检验的前提假设与适用条件
DW 检验并非普适工具,其有效性依赖以下条件:
- 回归模型必须包含截距项:若无截距,残差的构造方式不同,DW 的分布性质不再成立。
- 解释变量必须是非随机的(或在重复抽样中固定):这排除了包含滞后因变量作为解释变量的模型。在自回归模型中(例如 ),DW 统计量会偏向 2,即倾向于错误地不拒绝无自相关的原假设。此时应使用杜宾h统计量(Durbin's h test)。
- 误差项服从正态分布:这是 DW 分布推导的前提,虽然许多应用中对这一假设的偏离并不致命。
- 仅适用于一阶自相关:DW 检验设计的对立假设是 AR(1) 过程,对于高阶自相关(如 AR(p),),DW 的检验功效大打折扣。Breusch-Godfrey LM检验(也称序列相关 LM 检验)是更为通用(可检验 AR(p))的替代方案。
- 样本量不能过小:当 很小时,DW 的分布严重偏离正态近似,上下界表的覆盖范围有限。
扩展与替代检验
杜宾 h 统计量专为包含滞后因变量的模型设计。考虑 ,h 统计量定义为:
其中 可根据 DW 近似 获得。在大样本下,,可直接使用标准正态临界值。
Breusch-Godfrey 检验(BG 检验)是更现代的替代方法。它通过将残差对其滞后值及原始解释变量进行辅助回归来构造 LM 统计量,可同时检验任意阶自相关,且允许滞后因变量存在。由于其灵活性和更高的功效,BG 检验在当代实证研究中日益取代 DW 成为首选。
在实证研究中的应用
DW 统计量在经济学、金融学和社会科学的实证研究中广泛应用。研究者通常在回归结果表格末尾报告 DW 值,使读者能快速判断模型是否受到自相关的困扰。经验法则上,DW 值在 1.5 到 2.5 之间通常被视为可接受范围;低于 1.0 或高于 3.0 则需要严肃对待。
如果 DW 检验拒绝了无自相关的原假设,研究者可采取以下补救措施:使用广义最小二乘法(GLS)进行Cochrane-Orcutt迭代或Prais-Winsten变换估计;采用异方差与自相关一致标准误(HAC,即Newey-West标准误)进行稳健推断;或重新审视模型设定——有时显著的 DW 值暗示的不是纯粹的自相关,而是模型设定偏误,如遗漏了关键的滞后变量或采用了错误的函数形式。
计算示例
考虑一个包含 30 个观测值和 2 个解释变量(不含截距)的回归模型,残差平方和 ,相邻残差差的平方和 。则:
查杜宾-瓦特森表, 时 。因为 ,拒绝无自相关的原假设,判断存在显著正自相关。这一发现提示研究者需对标准误进行修正,或采用考虑自相关结构的估计方法。
DW 统计量以其简洁的公式、直观的含义和广泛的适用性,成为计量经济学教学与实践中不可或缺的诊断工具。尽管存在无结论区和仅能检测一阶自相关等局限,但作为回归诊断的第一步筛查,其价值历久弥新。