ARTICLE
回归断点设计
回归断点设计 (Regression Discontinuity Design) 回归断点设计(Regression Discontinuity Design,简称 RDD)是计量经济学中用于因果推断的一种准实验方法。其核心思想是利用一个已知的分配规则:当某个连续的驱动变量(running variable / forcing variable)越过一个预先
回归断点设计 (Regression Discontinuity Design)
回归断点设计(Regression Discontinuity Design,简称 RDD)是计量经济学中用于因果推断的一种准实验方法。其核心思想是利用一个已知的分配规则:当某个连续的驱动变量(running variable / forcing variable)越过一个预先设定的阈值(cutoff)时,个体接受处理的概率发生不连续的跳跃。在断点附近,略高于阈值和略低于阈值的个体在所有可观测及不可观测特征上几乎完全相同,仅处理状态存在差异,因此两组结果的差异可归因于处理的因果效应。RDD 被广泛认为是仅次于随机对照试验的最可信的因果推断方法。
基本框架与识别策略
考虑个体 ,驱动变量为 ,处理变量 ,断点为 。潜在结果为处理状态下的 与控制状态下的 ,观察到的结果 。RDD 的关键识别假设是条件期望函数 和 在 处连续。在此假设下,断点处的局部平均处理效应为:
这一识别策略仅需断点附近局部连续的弱条件,无需处理与潜在结果独立的强假设。直觉上,在断点附近无限窄的窗口内,处理分配近乎随机,RDD 近似于局部随机实验。
RDD 分为两种类型。精确断点回归(Sharp RDD, SRD):处理概率在阈值处从 0 跳至 1,即 是 的确定函数。模糊断点回归(Fuzzy RDD, FRD):阈值仅改变处理概率但非确定性, 在 处有不连续跳跃但跳跃幅度小于 1。模糊断点的处理效应通过 Wald 估计量识别,本质上等价于以阈值是否越过作为工具变量的两阶段最小二乘法估计,其中第一阶段为处理对越过阈值的回归,第二阶段将处理效应缩放至"遵从者"群体(compliers)。
估计方法
RDD 主要通过局部多项式回归实现。在断点附近选择带宽 ,仅使用 的观测值,分别对断点两侧拟合低阶多项式(通常为一阶线性或二阶二次),两曲线在断点处的截距差即为处理效应估计。多项式阶数的选择需权衡:一阶(线性)简单稳健但可能在断点处存在边界偏差;二阶能更好地捕捉曲率但方差较大且可能过拟合。Gelman 和 Imbens(2019)建议避免使用高阶多项式(三阶及以上),因其在断点附近的推断表现不稳定:
其中 和 分别是右侧和左侧回归在 处的截距。估计中常使用三角核等核函数,对更靠近断点的观测赋予更高权重。
带宽选择是 RDD 实践中最关键的决策。过大的带宽引入偏差——远离断点的个体不再可比;过小的带宽增加方差。常用方法包括:Imbens 和 Kalyanaraman(2012)提出的最小化均方误差的数据驱动最优带宽;Calonico、Cattaneo 和 Titiunik 提出的覆盖误差最优带宽,旨在构造稳健置信区间。现代实践中,研究者通常报告多种带宽下的结果以证明结论的稳健性。
有效性检验与诊断
RDD 的有效性依赖一系列可检验的假设:
- 驱动变量密度连续性检验(McCrary 检验):检验驱动变量密度函数在断点处是否连续。若个体能精确操纵自身在阈值某一侧的位置——例如纳税人刚好低于征税门槛、学生刚好越过及格线——密度会出现不连续跳跃,表明识别失效。
- 前定协变量连续性检验:检验与处理无关的基线特征(年龄、性别、预处理结果等)在断点处是否跳跃。若未发现显著跳跃,佐证了断点附近局部随机化的可信度。
- 安慰剂检验:在真实断点以外的其他位置重复 RDD 估计,应不发现显著的处理效应。
- 带宽敏感性分析:展示估计结果在不同带宽下的变化,证明结论不受特定选择支配。
历史、应用与前沿
RDD 的思想可追溯至 Thistlethwaite 和 Campbell(1960)对奖学金与学业成就的研究,但在经济学中的广泛普及始于 1990 年代末。Hahn、Todd 和 van der Klaauw(2001)提供了现代计量经济学框架,证明 RDD 在弱连续假设下识别局部平均处理效应。
RDD 广泛应用于多个领域。教育经济学中,Angrist 和 Lavy(1999)利用以色列 Maimonides 规则(班级人数不得超过 40 人的上限)估计班级规模对学生成绩的因果效应,发现小班显著提高阅读和数学成绩;政治经济学中,Lee(2008)利用美国众议院选举得票率 50\% 阈值,发现在职优势使连任概率提高约 40 个百分点;劳动经济学中利用法定退休年龄阈值分析养老金对劳动力供给的影响,或利用最低工资在不同地区的生效时点差异;健康经济学中利用出生体重阈值(如 1500 克为低出生体重分界线)评估重症监护干预对婴儿存活率和长期健康的影响;此外在环境经济学和犯罪学中也有日益增长的应用。
前沿发展包括:地理断点设计,以地理边界为多维断点进行空间 RDD,常用于评估学区边界两侧的房价与教育质量差异,或行政边界两侧的政策效应;拐点回归设计(Regression Kink Design, RKD),识别驱动变量在断点处斜率变化而非水平跳跃的处理效应,在税收累进门槛、失业保险金公式等斜率变化点有广泛应用;离散驱动变量 RDD,当驱动变量为离散值(如考试分数、年龄以年为单位)时,需使用聚类标准误并谨慎处理识别条件;以及 RDD 与机器学习方法的结合,使用 Lasso、随机森林等算法更灵活地拟合结果与驱动变量的关系以降低偏差。
RDD 的核心局限在于仅识别断点处的局部平均处理效应,外推至远离断点的个体需额外假设。然而,在政策评估中,断点处往往是制定者最关注的边际群体,因此 RDD 具有极强的政策相关性。其透明直观的研究设计和近乎实验的因果识别效力,使其成为实证微观经济学中最受信赖的因果推断工具之一。