ARTICLE

双重差分

双重差分 (Difference-in-Differences, DiD) 双重差分(Difference-in-Differences,简称 DiD 或 DD)是计量经济学和因果推断中应用最广泛的准实验方法之一,用于在观测数据中识别某项政策干预或处理(treatment)的因果效应。其核心思想是:通过比较处理组在干预前后的变化与控制组在同一时期的变化,将两

浏览 0 更新 2025-11-08

双重差分 (Difference-in-Differences, DiD)

双重差分(Difference-in-Differences,简称 DiD 或 DD)是计量经济学因果推断中应用最广泛的准实验方法之一,用于在观测数据中识别某项政策干预或处理(treatment)的因果效应。其核心思想是:通过比较处理组在干预前后的变化与控制组在同一时期的变化,将两者的"差分再差分",从而消除不随时间变化的组间固有差异以及两组共有的时间趋势,分离出纯粹的处理效应。

DiD 方法最早可追溯至 John Snow(1855)对伦敦霍乱疫情的分析,而其现代计量形式由 Ashenfelter 和 Card 等学者在 20 世纪 80 年代关于培训项目评估的研究中确立。此后,Card 和 Krueger(1994)关于最低工资与就业的经典论文将 DiD 推广为劳动经济学和政策评估的标准工具。

基本框架:2×2 双重差分

最简形式的 DiD 假设有两组个体(处理组 T=1T = 1 和控制组 T=0T = 0)和两个时期(处理前 t=0t = 0 和处理后 t=1t = 1)。处理组仅在 t=1t = 1 时接受干预,控制组在两个时期均不接受干预。潜在结果框架下,观测结果 YitY_{it} 可写为:

Yit=α+βTi+γt+δ(Ti×t)+εitY_{it} = \alpha + \beta \, T_i + \gamma \, t + \delta \, (T_i \times t) + \varepsilon_{it}

其中:

  • α\alpha 为控制组在处理前的基准均值(截距项);
  • β\beta 捕捉处理组与控制组之间不随时间变化的固有差异(组间固定效应);
  • γ\gamma 捕捉两组共有的时间趋势(时期固定效应);
  • δ\delta 即为双重差分估计量,度量处理效应的方向和大小;
  • εit\varepsilon_{it} 为随机误差项。

对上述模型取条件期望后做差,双重差分估计量可直观表达为:

δ=(E[YT=1,t=1]E[YT=1,t=0])\delta = \left( E[Y \mid T = 1, t = 1] - E[Y \mid T = 1, t = 0] \right)
  • \left( E[Y \mid T = 0, t = 1] - E[Y \mid T = 0, t = 0] \right)

第一个括号是处理组在干预前后的变化(包含处理效应和时间趋势),第二个括号是控制组同期变化(仅含时间趋势),两者相减即剥离出处理效应。在回归中,δ\delta 等于交互项系数,其 tt 检验的显著性即标志处理效应的统计显著。

平行趋势假设

双重差分的核心识别假设是平行趋势假设(Parallel Trends Assumption):在干预发生之前,处理组与控制组的结果变量遵循相同的时间趋势;换言之,若无干预,处理组的结果变化路径应与控制组完全平行。该假设不可直接检验——因为处理组在干预后已受处理,"无干预的反事实"不可观测——但研究者通常通过以下方式予以间接支持:

  1. 事前趋势检验:比较两组在干预前多个时期的结果变化,若各期处理组虚拟变量与时间趋势的交互项系数均不显著异于零,则支持平行趋势的可信度。
  2. 事件研究图(Event Study Plot):绘制以事件发生时间为横轴、各期处理效应估计值为纵轴的图形,直观展示事前趋势是否平行以及事后效应如何演化。
  3. 安慰剂检验:将处理时间人为提前至实际干预发生之前,或随机分配处理标签,若伪处理效应不显著,则加强基准结论的稳健性。

违反平行趋势假设时,DiD 估计量存在偏误。常见威胁包括:两组在干预前已经出现趋势分化、存在时变混淆因素、处理组在干预时间点附近发生其他同步事件等。

拓展形式

多时期与多组 DiD:当数据包含多个时期和多个处理组时(尤其政策在不同时间点分批推行),可采用双向固定效应模型(Two-way Fixed Effects, TWFE):

Yit=αi+λt+δDit+εitY_{it} = \alpha_i + \lambda_t + \delta \, D_{it} + \varepsilon_{it}

其中 αi\alpha_i 为个体固定效应,λt\lambda_t 为时期固定效应,DitD_{it} 为处理指示变量。近年研究(Goodman-Bacon, 2021;Callaway \& Sant'Anna, 2021)指出,在交错处理(staggered adoption)下,TWFE 估计量是若干不同处理组间和不同时间比较的加权平均,当处理效应存在异质性时,可能出现负权重问题,导致估计偏误甚至符号反转。新一代 DiD 估计量(如 Sun \& Abraham、Borusyak 等、Gardner 等)通过重新加权或广义矩估计消除负权重。

三重差分(Triple Differences, DDD):当平行趋势假设存疑时,可引入第三个维度的对照组(如不受政策影响的另一结果变量或另一个人群子集),以额外一层差分消除潜在的时变混淆。

连续 DiD:处理强度连续而非二元时,交互项 DitD_{it} 替换为连续剂量变量,识别的是剂量-反应效应。

与其他因果推断方法的关系

DiD 在因果推断方法谱系中占据独特位置。与随机对照试验相比,DiD 放松了随机分配的要求,但以平行趋势假设替代独立性假设。与工具变量法不同,DiD 不需要寻找外生工具变量,而是利用时间维度的变异。与断点回归设计相比,DiD 不依赖断点处的局部随机性,而是依赖跨时间可比性。与合成控制法相比,DiD 假设控制组等权重有效,而合成控制法通过数据驱动的最优加权构造更可比的反事实。

应用注意事项

应用 DiD 时需关注以下问题:

  • 聚类标准误:处理通常在群组(如地区、州、学校)层面实施,若未对群组层面聚类,标准误将严重低估,导致过度拒绝零假设。Bertrand、Duflo 和 Mullainathan(2004)证明了这一问题的严重性,并建议使用聚类稳健标准误。
  • 序列相关:多时期 DiD 中,结果变量的序列相关会加剧标准误偏误。当组数较少时(如少于 20 个群组),传统聚类标准误仍可能表现不佳,可考虑使用野自助法(Wild Bootstrap)或 Fisher 随机化检验。
  • 功能性形式:结果变量的对数变换隐含处理效应比例假设,需结合经济含义审慎选择。当结果变量包含大量零值时,可考虑泊松伪最大似然估计(PPML)。
  • 一般均衡效应与溢出:DiD 假设处理效应仅作用于处理组(SUTVA)。若存在政策溢出或一般均衡效应,估计量将有偏。

双重差分法因其直观的逻辑和较低的识别门槛,已成为实证经济学和政策评估的标准工具。然而,其有效性完全取决于平行趋势假设的可信度以及研究设计对时变混淆的处理。在交错处理、异质性效应等复杂情境下,应采用最新的方法论文献对传统 TWFE 估计量进行诊断和修正。