ARTICLE

因果效应

因果效应 (Causal Effect) 因果效应是因果推断领域的核心概念，指一个特定的干预或处理（Treatment）对一个结果（Outcome）所产生的净影响。在经济学、统计学、医学和社会科学中，识别因果效应回答的是"如果改变某个因素，结果会如何变化"这类反事实问题。例如：政策制定者想知道提高最低工资对就业的效应，公共卫生专家需要评估新疫苗对感染率的效应

浏览 53 更新 2025-10-26

因果效应 (Causal Effect)

因果效应是因果推断领域的核心概念，指一个特定的干预或处理（Treatment）对一个结果（Outcome）所产生的净影响。在经济学、统计学、医学和社会科学中，识别因果效应回答的是"如果改变某个因素，结果会如何变化"这类反事实问题。例如：政策制定者想知道提高最低工资对就业的效应，公共卫生专家需要评估新疫苗对感染率的效应，经济学家要求估计职业培训对收入的效应，教育研究者希望了解班级规模对学生成绩的影响。这些问题的共同点在于，它们关注的不是变量之间的相关性，而是干预导致的唯一性变化——即因果效应。

理解因果效应的关键在于区分相关关系与因果关系：观察到两个变量同步变化，不等于其中一个导致了另一个。可能存在遗漏变量、反向因果或样本选择等混淆因素。例如，冰淇淋销量与溺水人数高度相关，但这是因为夏季高温同时推动了二者，而非冰淇淋导致溺水。另一个经典例子是：拥有更多床位的医院其患者死亡率反而更低，但这可能是因为病情较轻的患者倾向于选择大医院，而非床位规模本身降低了死亡风险。因果效应的识别就是要在剥离了所有混淆因素之后，提炼出干预对结果的纯粹影响。

潜在结果框架

为精确界定因果效应，学界广泛采用由 Donald Rubin 发展的潜在结果框架，亦称鲁宾因果模型。对任意单元 $i$ （个体、企业或地区），设 $D_i=1$ 表示接受干预， $D_i=0$ 表示未接受。定义两种潜在状态： $Y_i(1)$ 为接受干预后的结果， $Y_i(0)$ 为未接受干预时的结果。则个体因果效应为 $\tau_i = Y_i(1) - Y_i(0)$ 。

这一简洁定义直指因果效应的本质：同一单元在干预与不干预两种平行世界中的结果差异。然而，这引出了因果推断的根本性问题：我们永远无法同时观测到 $Y_i(1)$ 和 $Y_i(0)$ ——现实中每个单元只能进入一种状态，另一状态永远缺失。因此，个体因果效应不可直接计算，所有因果推断都是在试图从观测数据中"补全"那个缺失的反事实。

平均因果效应

由于个体效应不可观测，研究通常转向群体层面的平均度量。主要有三种：

平均处理效应（ATE）： $ATE = E[Y_i(1) - Y_i(0)]$ ，即随机抽取一个体施加干预的期望效果。ATE 回答的是"政策如普遍实施，平均会带来多大变化"，是宏观政策评估的首选目标参数。
处理组平均处理效应（ATT）： $ATT = E[Y_i(1) - Y_i(0) \mid D_i=1]$ ，仅针对实际接受干预的群体。ATT 关注的是"参与者从项目中获得了多少收益"，常用于成本-收益分析和现有项目的效果评估。
局部平均处理效应（LATE）：由工具变量法识别，仅适用于因工具变量的变化而改变干预状态的"遵从者"亚群。LATE 的外部有效性有限，但在处理内生性时提供了可靠的局部因果估计。

选择性偏误

在非实验环境下，直接比较处理组和控制组的均值差异并不可靠。数学分解如下：

E[Y_i \mid D_i=1] - E[Y_i \mid D_i=0] = ATT + \big(E[Y_i(0) \mid D_i=1] - E[Y_i(0) \mid D_i=0]\big)

等式右侧第二项即为选择性偏误，衡量的是即使无干预，两组之间本就存在的系统性差异。例如，参加培训项目的员工可能本身更有上进心，因此即使不培训收入也更高。此时简单均值比较会高估培训的真实因果效应。现代因果推断方法的根本目标就是消除或削弱这一偏误。

识别方法概览

为克服选择性偏误，学界发展了一系列识别策略：

随机对照试验：通过随机分配干预状态，消除处理组与控制组在可观测和不可观测特征上的系统性差异，是识别因果效应的黄金标准。
双重差分法：比较处理组在干预前后的变化量与控制组同期变化量的差异，通过双重差分剔除不随时间变化的组间异质性和共同时间趋势，核心假设为平行趋势假设。
倾向得分匹配：基于可观测变量的倾向得分，为每个处理组个体匹配最相似的控制组个体，模拟随机化条件。其识别依赖条件独立性假设，即在控制了可观测协变量后，干预分配近似随机。
回归断点设计：利用政策或项目围绕某一连续变量的阈值分配干预的特点，比较阈值附近两侧的个体，估计局部因果效应。其信服力来自高质量断点附近的个体在除干预状态外几乎完全相同。
工具变量法：引入一个与干预选择相关但仅通过干预影响结果的外生工具变量，分离出干预的外生变动部分，估计 LATE。经典应用包括用距离大学的远近作为受教育年数的工具变量，来估计教育对收入的影响。

综上所述，因果效应在理论层面的定义简洁统一，但其在实证层面的识别充满挑战。一切因果推断的核心任务都是构建一个可信的反事实，而不同方法之间的根本差异，恰恰在于它们各自依赖何种假设和数据结构来补全这一反事实。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。