ARTICLE

增广 Dickey-Fuller 检验

增广 Dickey-Fuller 检验 (Augmented Dickey-Fuller Test) 增广 Dickey-Fuller 检验（Augmented Dickey-Fuller Test，简称 ADF 检验）是时间序列分析中最常用的单位根检验方法。它由 [[David Dickey]] 和 [[Wayne Fuller]] 于1979年提

浏览 0 更新 2026-07-15

增广 Dickey-Fuller 检验 (Augmented Dickey-Fuller Test)

增广 Dickey-Fuller 检验（Augmented Dickey-Fuller Test，简称 ADF 检验）是时间序列分析中最常用的单位根检验方法。它由 [[David Dickey]] 和 [[Wayne Fuller]] 于1979年提出，是对原始 Dickey-Fuller检验（DF 检验）的扩展，旨在解决 DF 检验在实际应用中面临的残差自相关问题。ADF 检验的原假设为"序列包含一个单位根"（即非平稳），备择假设为"序列是平稳的"。若不能拒绝原假设，则表明序列需要差分处理才能达到平稳性，这对于避免伪回归（Spurious Regression）和正确设定协整分析框架具有基础性意义。

从 DF 检验到 ADF 检验的动因

原始 DF 检验考虑三种形式的自回归模型。以最常用的含截距项形式为例，检验基于如下回归：

y_t = \rho y_{t-1} + \epsilon_t, \quad \epsilon_t \stackrel{\text{iid}}{\sim} (0, \sigma^2)

等价地，减掉 $y_{t-1}$ 得到：

\Delta y_t = \gamma y_{t-1} + \epsilon_t, \quad \gamma = \rho - 1

原假设 $H_0: \gamma = 0$ （即 $\rho = 1$ ，存在单位根），备择假设 $H_1: \gamma < 0$ （序列平稳）。检验统计量为 $\hat{\gamma}$ 的 $t$ 统计量，但在原假设下其分布并非标准正态或 $t$ 分布，而是 Dickey-Fuller分布（一种左偏的非标准分布），需要查专门的临界值表。

然而，DF 检验的关键局限在于它假设误差项 $\epsilon_t$ 为白噪声。在实际经济和金融时间序列中，残差往往存在序列相关性——即 $\epsilon_t$ 本身遵循某个自回归移动平均（ARMA）过程。当残差自相关时，DF 检验的统计量分布会发生扭曲，导致检验水平失真（实际第一类错误率偏离名义显著性水平）。ADF 检验通过在原回归中引入被解释变量的滞后差分项来吸收残差中的自相关结构，从而恢复检验的有效性。

ADF 检验的三种设定形式

ADF 检验将 DF 的误差项模型推广为 $\epsilon_t$ 服从 AR(p) 过程，并通过增广（Augmentation）——即向回归式中加入 $\Delta y_t$ 的滞后项——来参数化地消除残差自相关。检验可采用以下三种设定形式，三者对应不同的备择假设含义与不同的临界值分布：

形式一：无截距、无趋势（纯随机游走）

\Delta y_t = \gamma y_{t-1} + \sum_{i=1}^{p} \delta_i \Delta y_{t-i} + \epsilon_t

此形式假定序列在平稳状态下均值为零，适用于已经过中心化处理或理论均值为零的价格偏差、利差等序列。

形式二：含截距、无趋势

\Delta y_t = \alpha + \gamma y_{t-1} + \sum_{i=1}^{p} \delta_i \Delta y_{t-i} + \epsilon_t

这是实证研究中最常用的设定。截距项 $\alpha$ 在原假设下捕捉了随机游走过程的漂移项（drift），在备择假设下则代表平稳过程的非零均值。适用于大多数宏观经济和金融变量，如 GDP 对数水平、股票价格对数等。

形式三：含截距、含线性趋势

\Delta y_t = \alpha + \beta t + \gamma y_{t-1} + \sum_{i=1}^{p} \delta_i \Delta y_{t-i} + \epsilon_t

引入线性趋势项 $\beta t$ 后，备择假设对应趋势平稳过程（Trend-Stationary Process）：序列围绕一条确定性趋势线平稳波动。原假设下，序列是带漂移的随机游走。此形式适用于具有明显时间趋势的序列，如实际 GDP、消费水平等。

三种形式的原假设均为 $H_0: \gamma = 0$ 。不同之处在于：如果备择假设成立，三种形式分别意味着序列是平稳的（均值可能为零、非零、或含趋势）。在实际操作中，选择错误的形式可能导致检验效力（power）下降或结论逆转——例如，对趋势平稳序列错误地使用无趋势设定时，容易接受单位根原假设。

检验统计量与 Dickey-Fuller 分布

ADF 检验的核心统计量为基于 OLS 估计 $\hat{\gamma}$ 的 $t$ 统计量：

\tau = \frac{\hat{\gamma}}{\operatorname{SE}(\hat{\gamma})}

在原假设下，无论采用哪种设定形式， $\tau$ 均不服从标准正态分布。该统计量收敛于以维纳过程（Wiener Process）泛函表达的 Dickey-Fuller 分布。其临界值比标准正态更负（向左偏移）——例如，在含截距情形下，5\% 显著性水平的临界值约为 $-2.86$ ，而非正态的 $-1.645$ 。临界值的具体数值通过 Monte Carlo 模拟获得，取决于样本容量 $T$ 和采用的设定形式（是否含截距、是否含趋势）。大样本下，三组临界值各自收敛于不同的渐近分布，但有限样本下需参照 Dickey 和 Fuller 原表或响应面（response surface）公式。

由于 $\tau$ 分布的左偏特性，检验为单侧（左尾）检验：若 $\tau$ 小于（即比）临界值更负，则拒绝 $H_0$ ，认为序列平稳；反之不能拒绝单位根原假设。这一点与常规 $t$ 检验的直觉刚好相反，是初学者容易混淆之处。

滞后阶数的选择

ADF 检验的实际表现高度依赖于滞后阶数 $p$ 的选择。 $p$ 过小，残差中的自相关未被充分消除，导致检验水平失真（实际拒绝率高于名义水平）； $p$ 过大，会引入多余的参数，降低检验效力（无谓消耗自由度，使备择假设下更不易拒绝原假设）。

常用的滞后阶数选择方法包括：

信息准则法：在预设最大滞后阶数 $p_{\max}$ 下，对每个候选阶数估计 ADF 回归，计算 AIC（Akaike Information Criterion）、BIC（Schwarz Bayesian Criterion）或 HQ（Hannan-Quinn）信息准则，选择使准则最小化的 $p$ 。BIC 倾向于选择更精简的模型（渐近一致性），AIC 则更宽松（可能高估阶数但在有限样本下效力常更好）。实践中，基于 BIC 的选择在控制检验水平方面表现较稳健。

一般到特殊（General-to-Specific）法：从较大的 $p_{\max}$ 开始，逐步检验最高阶滞后项的显著性，若其 $t$ 统计量不显著则剔除并重新估计，直至最后一阶滞后项显著。该方法由 Ng 和 Perron（1995）主张，配合特定的显著性水平（如 10\%）使用。

数据依赖规则：Schwert（1989）提出的经验公式 $p_{\max} = \left\lfloor 12 \cdot \left(\frac{T}{100}\right)^{1/4} \right\rfloor$ 给出了最大滞后阶数的建议上限，在计量软件中广泛默认使用。之后可在此上限内结合信息准则确定最优 $p$ 。

检验步骤的实操建议

在实际应用中，建议遵循如下系统步骤以避免常见的推断陷阱：

第一，可视化与初步判断。绘制序列的时间序列图和自相关函数（ACF）图。缓慢衰减的 ACF（在滞后数十期后仍显著为正）是单位根的典型信号，而快速衰减则暗示平稳性。

第二，确定设定形式。观察序列是否存在明显的向上或向下趋势。若曲线呈明显的时间趋势，使用形式三（含截距和趋势）；若无趋势但在非零水平附近波动，使用形式二（含截距）；仅在序列明显围绕零值波动时才考虑形式一。

第三，选择滞后阶数。确定 $p_{\max}$ （如 Schwert 公式），在 $0 \leq p \leq p_{\max}$ 范围内基于 BIC 或 AIC 选择最优 $p$ 。

第四，执行 ADF 检验并解读结果。比较 $\tau$ 统计量与相应设定形式下的临界值。若 $\tau <$ 临界值（即更负），拒绝 $H_0$ ；否则，不能拒绝单位根。未能拒绝时不应轻易下结论"序列有单位根"，而应结合检验效力——ADF 检验在小样本下效力较低，可能将接近单位根的平稳过程误判为非平稳。

第五，稳健性检查。考虑辅以其他单位根检验——如 KPSS检验（以平稳性为原假设，与 ADF 形成互补）、Phillips-Perron检验（非参数修正自相关）或 DF-GLS检验（Elliott-Rothenberg-Stock 提出的变形，通常具有更高的检验效力）——进行交叉验证。同时，对差分后的序列再执行 ADF 检验以确认差分阶数的充分性。

与其他单位根检验的比较

ADF 检验与 Phillips-Perron（PP）检验是应用计量中两大主流单位根检验。两者的核心区别在于处理残差自相关的策略：ADF 采用参数化方法，通过加入滞后差分项直接建模自相关结构；PP 检验则采用 非参数修正，利用 Newey-West 型异方差自相关一致（HAC）协方差估计来修正检验统计量的标准误，无需显式选择滞后阶数。PP 检验在小样本下的水平性质较好，但在残差存在负自相关（即 MA 成分为负）时效力可能急剧下降。ADF 在正确设定滞后阶数的条件下通常表现更稳定。

KPSS 检验则将原假设反向设置为"序列是平稳的"，与 ADF 形成互补。联合使用 ADF 和 KPSS 可以得出更强的联合推断：若 ADF 拒绝单位根而 KPSS 不拒绝平稳性，则序列很可能平稳；若 ADF 不拒绝而 KPSS 拒绝平稳性，则序列很可能有单位根。两者结论一致时推断可信度最高，不一致时（如均拒绝或均不拒绝）则需谨慎解释。

局限性与注意事项

ADF 检验的主要局限包括：其一，低效力问题——当真实的 $\rho$ 接近但不等于 1（如 $\rho = 0.95$ ）时，ADF 检验在有限样本下很难区分单位根与高持久性的平稳过程，导致第二类错误（未能拒绝单位根）的概率偏高。其二，结构突变的干扰——若序列存在水平或趋势的结构突变（如政策改革、金融危机），标准 ADF 检验会错误地将趋势平稳但含结构突变的序列判定为非平稳，Perron 结构突变检验和 Zivot-Andrews 检验对此进行了拓展。其三，季节性单位根——对于季度或月度数据，若存在季节频率上的单位根，标准的（零频）ADF 检验无法检测，需使用 HEGY检验等方法。其四，面板情形——对多截面时间序列的面板数据，单独对每个个体执行 ADF 检验效力不足，面板单位根检验（如 LLC 检验、IPS 检验）通过汇集截面信息提高了检验效力。

尽管存在上述局限，ADF 检验凭借其简洁的回归形式、清晰的统计理论和计量软件的广泛支持（如 Stata 的 dfuller、R 的 tseries::adf.test、Python 的 statsmodels.tsa.stattools.adfuller），仍然是实证研究中进行平稳性判断的第一道门槛，也是任何严谨的时间序列分析的起点。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。