ARTICLE
因果效应
因果效应 (Causal Effect) 因果效应是因果推断领域的核心概念,指一个特定的干预或处理(Treatment)对一个结果(Outcome)所产生的净影响。在经济学、统计学、医学和社会科学中,识别因果效应回答的是"如果改变某个因素,结果会如何变化"这类反事实问题。例如:政策制定者想知道提高最低工资对就业的效应,公共卫生专家需要评估新疫苗对感染率的效应
因果效应 (Causal Effect)
因果效应是因果推断领域的核心概念,指一个特定的干预或处理(Treatment)对一个结果(Outcome)所产生的净影响。在经济学、统计学、医学和社会科学中,识别因果效应回答的是"如果改变某个因素,结果会如何变化"这类反事实问题。例如:政策制定者想知道提高最低工资对就业的效应,公共卫生专家需要评估新疫苗对感染率的效应,经济学家要求估计职业培训对收入的效应,教育研究者希望了解班级规模对学生成绩的影响。这些问题的共同点在于,它们关注的不是变量之间的相关性,而是干预导致的唯一性变化——即因果效应。
理解因果效应的关键在于区分相关关系与因果关系:观察到两个变量同步变化,不等于其中一个导致了另一个。可能存在遗漏变量、反向因果或样本选择等混淆因素。例如,冰淇淋销量与溺水人数高度相关,但这是因为夏季高温同时推动了二者,而非冰淇淋导致溺水。另一个经典例子是:拥有更多床位的医院其患者死亡率反而更低,但这可能是因为病情较轻的患者倾向于选择大医院,而非床位规模本身降低了死亡风险。因果效应的识别就是要在剥离了所有混淆因素之后,提炼出干预对结果的纯粹影响。
潜在结果框架
为精确界定因果效应,学界广泛采用由 Donald Rubin 发展的潜在结果框架,亦称鲁宾因果模型。对任意单元 (个体、企业或地区),设 表示接受干预, 表示未接受。定义两种潜在状态: 为接受干预后的结果, 为未接受干预时的结果。则个体因果效应为 。
这一简洁定义直指因果效应的本质:同一单元在干预与不干预两种平行世界中的结果差异。然而,这引出了因果推断的根本性问题:我们永远无法同时观测到 和 ——现实中每个单元只能进入一种状态,另一状态永远缺失。因此,个体因果效应不可直接计算,所有因果推断都是在试图从观测数据中"补全"那个缺失的反事实。
平均因果效应
由于个体效应不可观测,研究通常转向群体层面的平均度量。主要有三种:
- 平均处理效应(ATE):,即随机抽取一个体施加干预的期望效果。ATE 回答的是"政策如普遍实施,平均会带来多大变化",是宏观政策评估的首选目标参数。
- 处理组平均处理效应(ATT):,仅针对实际接受干预的群体。ATT 关注的是"参与者从项目中获得了多少收益",常用于成本-收益分析和现有项目的效果评估。
- 局部平均处理效应(LATE):由工具变量法识别,仅适用于因工具变量的变化而改变干预状态的"遵从者"亚群。LATE 的外部有效性有限,但在处理内生性时提供了可靠的局部因果估计。
选择性偏误
在非实验环境下,直接比较处理组和控制组的均值差异并不可靠。数学分解如下:
等式右侧第二项即为选择性偏误,衡量的是即使无干预,两组之间本就存在的系统性差异。例如,参加培训项目的员工可能本身更有上进心,因此即使不培训收入也更高。此时简单均值比较会高估培训的真实因果效应。现代因果推断方法的根本目标就是消除或削弱这一偏误。
识别方法概览
为克服选择性偏误,学界发展了一系列识别策略:
- 随机对照试验:通过随机分配干预状态,消除处理组与控制组在可观测和不可观测特征上的系统性差异,是识别因果效应的黄金标准。
- 双重差分法:比较处理组在干预前后的变化量与控制组同期变化量的差异,通过双重差分剔除不随时间变化的组间异质性和共同时间趋势,核心假设为平行趋势假设。
- 倾向得分匹配:基于可观测变量的倾向得分,为每个处理组个体匹配最相似的控制组个体,模拟随机化条件。其识别依赖条件独立性假设,即在控制了可观测协变量后,干预分配近似随机。
- 回归断点设计:利用政策或项目围绕某一连续变量的阈值分配干预的特点,比较阈值附近两侧的个体,估计局部因果效应。其信服力来自高质量断点附近的个体在除干预状态外几乎完全相同。
- 工具变量法:引入一个与干预选择相关但仅通过干预影响结果的外生工具变量,分离出干预的外生变动部分,估计 LATE。经典应用包括用距离大学的远近作为受教育年数的工具变量,来估计教育对收入的影响。
综上所述,因果效应在理论层面的定义简洁统一,但其在实证层面的识别充满挑战。一切因果推断的核心任务都是构建一个可信的反事实,而不同方法之间的根本差异,恰恰在于它们各自依赖何种假设和数据结构来补全这一反事实。