ARTICLE
回归不连续
回归不连续设计 (Regression Discontinuity Design) 回归不连续设计(Regression Discontinuity Design, RDD)是一种准实验因果推断方法,当干预分配由某一连续变量(即分配变量)是否超过已知阈值决定时,通过比较阈值附近个体的结果差异来识别处理效应。该方法最早由 Thistlethwaite 和 Ca
回归不连续设计 (Regression Discontinuity Design)
回归不连续设计(Regression Discontinuity Design, RDD)是一种准实验因果推断方法,当干预分配由某一连续变量(即分配变量)是否超过已知阈值决定时,通过比较阈值附近个体的结果差异来识别处理效应。该方法最早由 Thistlethwaite 和 Campbell(1960)提出,用于评估奖学金对学生未来学业成就的影响,后经 Hahn、Todd 和 Van der Klaauw(2001)等人的发展,RDD 在计量经济学、政治学、劳动经济学和公共政策评估等领域获得了广泛的应用,成为因果推断工具箱中最接近随机实验的非实验设计之一。
基本逻辑与识别策略
RDD 的核心思想基于一个直观的假设:在阈值附近的个体具有相似的可观测与不可观测特征,因此它们的处理状态差异近乎随机。用反事实框架表示,处理效应的定义为:
其中 为分配变量, 为已知阈值, 和 分别表示接受处理与未接受处理的潜在结果。该等式意味着,处理效应等于结果变量在阈值处的右侧极限与左侧极限之差。
Sharp RDD vs. Fuzzy RDD:当分配变量超过阈值后所有个体都接受处理(或都不接受处理)时,称为精确回归不连续设计(Sharp RDD),此时上述公式直接给出平均处理效应(ATE)。当超过阈值仅改变接受处理的概率而非确定性地赋予处理时,称为模糊回归不连续设计(Fuzzy RDD),此时需要借助工具变量方法——以是否超过阈值作为处理的工具变量,估计局部平均处理效应(LATE)。
关键假设与验证
RDD 的有效性依赖于两个核心假设:
- 连续性假设:结果变量的条件期望函数 和 在阈值 处连续。这意味着在不存在处理的情况下,阈值附近的结果不会出现跳跃。此假设不可直接检验,但可通过多种间接验证来增强其可信度。
- 操纵检验:个体无法精确操控分配变量以选择处理状态。McCrary(2008)提出了密度检验,通过检查分配变量在阈值处的密度函数是否连续——若存在突兀的堆叠或断层,则暗示存在人为操纵。例如,在评估最低工资对就业的影响时,若企业可以精确控制员工的工资水平使其刚好达到最低工资标准,RDD 估计就会产生偏误。
常见的有效性验证方法还包括:检验协变量在阈值处的连续性(若协变量在阈值处出现跳跃,则说明处理分配可能并非准随机)、使用不同的带宽进行敏感性分析、以及采用 placebo 阈值检验(在非真实的阈值处检验是否存在显著跳跃)。
估计方法
参数方法
最简单的参数方法是在阈值两侧分别拟合线性或多项式回归:
其中 为处理指示变量, 即为处理效应的估计量。多项式阶数的选择需谨慎——阶数过低可能导致遗漏非线性趋势的偏误,阶数过高则增加方差并降低估计稳定性。Gelman 和 Imbens(2019)建议避免使用高阶多项式(如三阶以上),主张优先使用局部线性回归。
非参数方法:局部线性回归
目前的主流方法是使用局部线性回归(Local Linear Regression),即在阈值附近选取一个带宽 ,仅使用 内的观测值,在两侧分别拟合带核权重的线性回归。带宽的选择是 RDD 估计中最重要的实践决策:
- Imbens-Kalyanaraman(IK)最优带宽:最小化均方误差(MSE)的渐进最优带宽
- 交叉验证带宽:通过最小化留一法预测误差确定
- CCT 带宽:Calonico、Cattaneo 和 Titiunik(2014)提出的 MSE 最优带宽配合偏差校正
方差估计与推断
RDD 标准误的估计需使用异方差稳健标准误(如 Huber-White 估计量)。Calonico 等(2014)进一步提出了偏差校正后的稳健推断方法,解决局部线性回归因渐近偏差导致的置信区间覆盖不足问题。在实践中,报告不同带宽下的估计结果以及相应的稳健置信区间已成为行业标准。
带宽选择与敏感性分析
带宽选择在 RDD 中至关重要,因为它直接决定了估计的偏差-方差权衡。较小的带宽降低偏误但增大方差,较大的带宽提升统计效力但可能引入偏误。推荐的做法包括:
- 报告 IK、CCT 及交叉验证等多种带宽下的估计结果
- 绘制敏感度图:展示不同带宽下处理效应估计值的变化轨迹
- 使用 Donut RDD:排除阈值附近极小范围内的观测值,以检验局部操纵的敏感性
- 执行安慰剂检验:在非阈值点进行 RDD 估计,预期不应发现显著效应
应用案例
RDD 在实证研究中应用广泛。经典的例子包括:利用高考分数线的断点估计大学教育对收入的因果效应——分数线附近的考生在入学概率上存在断裂,但其他特征相似;利用政党当选门槛研究政党执政对经济政策的影响——候选人在得票率跃过 50\% 的临界点时获得执政地位;利用低保资格的收入门槛评估社会福利对劳动供给的行为反应。这些场景的共同特征是:存在一个外生的、非个体所能完全操控的阈值,使得阈值两侧的结果差异可以可信地归因于处理的因果效应。
局限性与注意事项
RDD 虽然内部效度高,但存在若干局限:
- 外部效度有限:RDD 估计的局部平均处理效应仅适用于阈值附近的人群,不能直接推广到远离阈值的样本
- 统计效力:由于仅使用阈值附近的数据,有效样本量远小于全样本,RDD 需要足够的样本聚集在阈值附近才能保证估计精度
- 分配变量的操控:若个体能精确控制分配变量,RDD 的因果识别即告失效,因此分配变量的外生性验证至关重要
- 多阈值与多分配变量:当存在多个处理维度或多个分配标准时,RDD 的设计与推断更加复杂
总结
回归不连续设计以其透明、直观的识别策略和相对较弱的假设条件,成为现代因果推断中最受推崇的准实验方法之一。它不需要寻找外生的工具变量,也不需要依赖不可观测的选择方程假设,仅需在阈值附近存在一个"天然的随机化"机制。随着非参数估计方法的完善和计算工具的普及,RDD 已成为政策评估和实证经济学的基础技能。然而,研究者必须对分配变量的外生性、带宽选择的敏感性和外部效度的局限保持清醒认识,才能充分发挥这一方法在因果识别中的独特优势。