ARTICLE
因果推断
因果推断 (Causal Inference) 因果推断 (Causal Inference) 是统计学、计量经济学、流行病学、计算机科学和许多其他定量学科中的核心分支。它旨在从数据中识别和量化因果关系——即"X导致Y"——而不仅仅是描述相关关系(即"X和Y一同变化")。因果推断提供了一套完整的理论框架和分析方法,用于评估某项干预的真实效果,例如一项公共政策
因果推断 (Causal Inference)
因果推断 (Causal Inference) 是统计学、计量经济学、流行病学、计算机科学和许多其他定量学科中的核心分支。它旨在从数据中识别和量化因果关系——即"X导致Y"——而不仅仅是描述相关关系(即"X和Y一同变化")。因果推断提供了一套完整的理论框架和分析方法,用于评估某项干预的真实效果,例如一项公共政策是否降低了失业率、一种新药是否改善了患者预后、或一个广告投放是否提升了销售额。与纯粹的描述性分析不同,因果推断的核心挑战在于处理反事实问题:我们永远无法同时观察到同一个体在接受干预和未接受干预两种状态下的结果。正是这一根本性的信息缺失使得因果推断既是科学研究的核心追求,也是方法论上最具挑战性的领域之一,促使研究者不断开发创新性的识别策略和分析工具,从而在有限的信息条件下尽可能逼近因果关系的真相。
潜在结果框架
现代因果推断的方法论基础是潜在结果框架 (Potential Outcomes Framework),也被称为奈曼-鲁宾因果模型 (Neyman-Rubin Causal Model)。该框架由Jerzy Neyman于1923年首次提出,后由Donald Rubin系统发展,将因果效应严格定义在个体层面。对于研究中的每一个体,用 表示其是否接受了处理: 表示接受了处理, 表示未接受处理(处于对照组)。对于每一个体 ,存在两个潜在结果: 和 ,分别代表接受处理和未接受处理时的结果变量值。个体的因果效应 (ICE) 定义为 。
因果推断的根本性难题
对于任何一个体 ,我们在同一时间点永远只能观测到两个潜在结果中的一个。如果个体确实接受了处理,我们能观测到的是 ,而 成为一个永远无法直接观测的反事实 (counterfactual)。反之亦然。既然个体因果效应 不可直接计算,实证研究转向估计群体的平均处理效应 (ATE):
ATE衡量在整个研究群体中一项干预平均带来的效果大小。除了ATE之外,研究者也经常关注处理组的平均处理效应 (ATT),即那些实际接受处理的人群的平均因果效应。ATT在政策评估中具有更直接的现实意义,因为它直接衡量了一项政策对目标受益者的实际影响程度,这对于政策制定者和公共管理者来说是最核心的评估指标和重要决策依据。
选择性偏误的来源
一个常见的错误是直接比较处理组和对照组的观测结果均值并将其解读为因果效应。通过数学分解可以清晰地看到这种做法的偏误来源:
观测差异由ATT和选择性偏误(Selection Bias)两部分构成。选择性偏误衡量的是即使在没有施加任何处理的情况下,处理组和对照组之间的系统性差异。混淆变量 (Confounding Variable) 是导致选择性偏误的最常见原因——它既影响处理分配又影响结果变量。一个经典例子是冰淇淋销量与溺水人数之间的正相关关系,其背后的混淆变量是"天气炎热":炎热天气同时增加了冰淇淋消费和游泳行为,而游泳行为导致了更多的溺水事故。
随机对照试验 (RCT)
随机对照试验 (RCT) 是解决选择性偏误的黄金标准。随机分配从设计上打破了任何系统性因素——无论是可观测的还是不可观测的——与处理分配之间的关联。在数学上,随机化使处理分配 与潜在结果 相互统计独立。此时选择性偏误项为零,处理组与对照组的均值差异就是ATE的无偏估计量。尽管RCT在逻辑上最为严谨,但在社会科学研究中,由于伦理约束、成本限制或外部有效性等问题,RCT往往不可行。
观测性数据的识别策略
当RCT不可行时,研究者借助识别策略 (Identification Strategy) 从观测性数据中推断因果关系。每种策略都依赖一组特定的可检验或不可检验的假设。
回归与控制变量
通过回归模型控制所有可观测的混淆变量 ,依赖条件独立性假设 (CIA):在给定 的条件下,处理分配近似随机。该方法要求所有相关混淆变量均可被准确测量。
双重差分法 (DID)
适用于面板数据,通过比较处理组和对照组在政策干预前后的变化差异来消除不随时间变化的组间差异。核心假设是平行趋势假设:在没有干预的情况下,两组的平均结果变化趋势本应保持一致。
工具变量法 (IV)
当处理变量存在内生性时,寻找工具变量 必须满足两个条件:相关性( 与 相关)和排他性约束( 仅通过 影响 )。通过两阶段最小二乘法 (2SLS) 获得一致估计。
回归断点设计 (RDD)
处理分配由连续分配变量是否超过特定断点决定。利用断点附近个体的近似随机性来估计因果效应,核心假设是除处理外其他因素在断点处连续变化。
有向无环图 (DAGs)
由Judea Pearl发展的图形化工具,通过节点和有向边构建因果关系网络,系统识别混淆变量并判断因果效应的可识别性。