# 断点回归设计 (Regression Discontinuity Design)
断点回归设计 (Regression Discontinuity Design, RDD),或称 回归不连续设计,是一种强大的{{{准实验}}} (quasi-experimental) 方法,广泛应用于{{{经济学}}}、{{{政治学}}}、{{{教育学}}}和社会学等领域,旨在估计某项干预或政策的{{{因果效应}}} (causal effect)。RDD的核心思想是利用一个连续的分配变量 (assignment or running variable) 中存在的明确断点 (cutoff or threshold) 来进行因果推断。在该断点处,个体接受处理 (treatment) 的状态发生突变,从而创造了一个类似于{{{随机对照试验}}} (Randomized Controlled Trial, RCT) 的局部环境。
## 核心思想与直觉
断点回归设计适用于这样一种情境:个体是否接受某项处理完全或主要取决于其在一个连续变量上的得分是否超过一个特定的临界值。
这个设计包含三个关键要素:
1. 分配变量 (Assignment/Running Variable, $R$):一个连续或近似连续的变量,其数值决定了个体是否被分配到处理组。例如,考试分数、年龄、收入水平等。 2. 断点 (Cutoff, $c$):分配变量上的一个预先确定的临界值。当个体的分配变量值跨过这个断点时,其接受处理的状态就会改变。 3. 结果变量 (Outcome Variable, $Y$):我们关心的、可能受到处理影响的变量。例如,未来的收入、健康状况或选举结果。
RDD的直觉非常清晰:考虑那些分配变量得分恰好在断点两侧的个体——即得分略高于断点和略低于断点的两组人。由于他们的得分非常接近,我们可以合理地假设他们在其他所有方面(无论是可观测的特征如家庭背景,还是不可观测的特征如个人动机)都是非常相似的,几乎无法区分。唯一的系统性差异在于,一组人(得分高于断点者)接受了处理,而另一组人(得分低于断点者)没有。
在这种情况下,断点两侧的局部区域就形成了一个“局部随机实验”。因此,如果在断点处观察到结果变量出现了不连续的“跳跃”(jump),我们就可以将这个跳跃归因于处理的因果效应。
## 断点回归的类型
根据处理分配规则的严格程度,RDD可以分为两种主要类型。
### 一. 清晰断点回归 (Sharp Regression Discontinuity, SRD)
在清晰断点回归中,处理的分配是分配变量的一个确定性函数。所有得分不低于断点 $c$ 的个体都接受处理,而所有得分低于断点的个体都确定不接受处理。
用数学语言表示,令 $D_i$ 为个体 $i$ 的处理状态($D_i=1$ 表示接受处理,$D_i=0$ 表示未接受处理),$R_i$ 为其分配变量的得分,则: $$ D_i = \mathbb{I}(R_i \ge c) $$ 其中 $\mathbb{I}(\cdot)$ 是一个{{{示性函数}}}。
SRD下的处理效应被定义为结果变量 $Y$ 的条件期望函数在断点 $c$ 处的跳跃大小。这个效应通常被称为局部平均处理效应 (Local Average Treatment Effect, LATE)。 $$ \tau_{SRD} = \lim_{r \downarrow c} E[Y_i | R_i = r] - \lim_{r \uparrow c} E[Y_i | R_i = r] $$ 这个公式的含义是,比较恰好在断点右侧个体的平均结果与恰好在断点左侧个体的平均结果之差。
### 二. 模糊断点回归 (Fuzzy Regression Discontinuity, FRD)
在许多现实情境中,跨越断点并不完美地决定处理状态,而仅仅是改变了个体接受处理的概率。这就是模糊断点回归的情境。例如,一项奖学金政策可能规定分数超过某个阈值的学生有“资格”申请,但并非所有有资格的学生都会去申请或最终获得奖学金;同时,少数没有资格的学生也可能通过特殊渠道获得了资助。
在FRD中,断点改变了处理的概率,但不为0或1。即: $$ \lim_{r \downarrow c} P(D_i=1 | R_i=r) \neq \lim_{r \uparrow c} P(D_i=1 | R_i=r) $$ FRD的估计需要借助{{{工具变量}}} (Instrumental Variable, IV) 的思想。在这里,跨越断点这一事件(即 $\mathbb{I}(R_i \ge c)$)可以作为一个有效的工具变量,因为它: 1. 与实际接受处理 $D_i$ 相关(即改变了处理概率)。 2. 除了通过影响处理状态外,与结果变量 $Y_i$ 无直接关系(这是基于RDD的核心假设)。
FRD的处理效应(同样是一个LATE)是结果变量在断点处的跳跃幅度与处理概率在断点处的跳跃幅度的比率: $$ \tau_{FRD} = \frac{\lim_{r \downarrow c} E[Y_i | R_i = r] - \lim_{r \uparrow c} E[Y_i | R_i = r]}{\lim_{r \downarrow c} E[D_i | R_i = r] - \lim_{r \uparrow c} E[D_i | R_i = r]} $$ 这个估计量在形式上是一个{{{Wald估计量}}}。分母衡量了政策的“第一阶段”效应(即政策对实际参与率的影响),而分子是政策的“简约式”效应(即政策对最终结果的影响)。
## 关键假设
RDD的有效性依赖于几个关键假设,如果这些假设不成立,其因果推断的结论将是不可靠的。
1. 连续性假设 (Continuity Assumption):这是RDD最核心的假设。它要求,在没有处理干预的情况下,由其他所有因素决定的{{{潜在结果}}} (potential outcomes) 作为分配变量的函数,在断点处是连续的。换言之,如果处理完全无效,我们不应该在断点处观察到结果变量的任何跳跃。因此,任何观测到的跳跃都只能归因于处理本身。
2. 不可操纵性假设 (No Manipulation of the Running Variable):个体不能为了获得处理而精确地操纵自己的分配变量得分,使其恰好落在断点的有利一侧。如果存在这种操纵行为(例如,学生贿赂老师修改刚好不及格的分数),那么断点两侧的个体就不再具有可比性,因为他们会因动机等不可观测特征而产生系统性差异。这个假设可以通过检查分配变量的{{{概率密度}}}在断点附近是否连续来检验(例如使用McCrary检验)。
## 估计方法
在实践中,估计断点处的跳跃主要采用非参数或半参数的方法。
局部线性回归 (Local Linear Regression) 是当前最受推崇和广泛使用的方法。其基本思想是: 1. 选择一个围绕断点的带宽 (bandwidth, $h$),只使用分配变量 $R_i$ 在 $[c-h, c+h]$ 区间内的观测值。 2. 在该带宽内,分别对断点两侧的数据拟合线性回归模型。
一个常见的回归模型形式如下,该模型在带宽内进行估计: $$ Y_i = \alpha + \tau D_i + \beta_1 (R_i - c) + \beta_2 D_i(R_i - c) + \epsilon_i $$ 其中: * $D_i$ 是处理虚拟变量($D_i = \mathbb{I}(R_i \ge c)$)。 * $(R_i - c)$ 是中心化后的分配变量,允许数据在断点两侧有不同的斜率。 * $D_i(R_i - c)$ 是交互项,允许断点两侧的回归线斜率不同。 * 系数 $\tau$ 就是我们感兴趣的RDD处理效应的估计值,它代表了在断点 $c$ 处两条回归线截距的差异。
带宽选择是局部线性回归中的一个关键步骤。带宽太宽会引入远距离观测值的偏差(因为远处的个体可比性差);带宽太窄会减少样本量,导致估计的{{{方差}}}增大。现代计量经济学软件通常内置了数据驱动的最优带宽选择程序。
## 有效性检验
为了增强RDD结果的可信度,研究者通常会进行一系列的有效性检验(也称稳健性检验):
* 分配变量的密度检验:如前述的McCrary检验,检查在断点处个体数量是否存在不自然的跳跃。 * 协变量平衡性检验 (Covariate Balance Test):检验那些不受处理影响的前定{{{协变量}}}(如性别、出生年份)在断点处是否也出现跳跃。如果这些本应平滑变化的变量也跳跃了,则说明断点两侧的个体可能存在系统性差异,RDD的识别假设值得怀疑。 * 安慰剂检验 (Placebo Test):在不存在真实政策断点的位置(“安慰剂断点”)进行RDD分析,预期不应发现显著的跳跃。或者,对一个理论上不受处理影响的“安慰剂结果变量”进行分析,同样预期没有效应。 * 不同带宽和核函数的稳健性检验:检查估计结果是否对带宽选择和局部回归中使用的{{{核函数}}}(如矩形核、三角核)不敏感。
## 优缺点
### 优点 * 高{{{内部有效性}}} (Internal Validity):当假设成立时,RDD被认为是准实验方法中可信度最高的,其结论接近于随机实验。 * 透明直观:分配机制清晰,结果可以通过图形直观地展示,易于理解和沟通。
### 缺点 * 低{{{外部有效性}}} (External Validity):RDD估计的是针对断点附近人群的局部平均处理效应(LATE)。这一效应不一定能推广到远离断点的人群,或推广到其他背景环境中。 * 数据要求高:需要有足够多的观测值密集分布在断点附近,才能获得有足够{{{统计功效}}} (statistical power) 的精确估计。 * 适用范围有限:仅适用于存在明确分配规则和断点的干预项目。
## 应用实例:奖学金对未来收入的影响
一个经典的RDD应用是研究获得优异生奖学金对学生未来成就的影响。
* 处理:获得“国家优异生奖学金”。 * 分配变量 ($R$):高中生的学术能力评估测试 (PSAT) 成绩。 * 断点 ($c$):每年由官方公布的、获得该奖学金所需的最低分数线。 * 结果变量 ($Y$):学生大学毕业后若干年的收入。
研究者可以比较PSAT分数刚好高于分数线(获得奖学金)和刚好低于分数线(未获得奖学金)的两组学生未来的收入。由于这两组学生的能力、家庭背景等都极为相似,其未来收入的显著差异就可以归因于获得奖学金本身带来的效应(如声誉、财务支持等)。