ARTICLE

因果

因果 (Causality) 因果是统计学、计量经济学和科学哲学中的核心概念，指一个变量（原因）对另一个变量（结果）所产生的真实、方向性的影响。与仅描述变量间统计关联的相关关系不同，因果关系回答的是反事实问题："如果原因发生变化，结果会发生什么？" 确立因果关系是政策评估、医学研究和经济分析的终极目标。相关不等于因果区分相关与因果是实证研究中最基本的挑战

浏览 7 更新 2025-10-26

因果 (Causality)

因果是统计学、计量经济学和科学哲学中的核心概念，指一个变量（原因）对另一个变量（结果）所产生的真实、方向性的影响。与仅描述变量间统计关联的相关关系不同，因果关系回答的是反事实问题："如果原因发生变化，结果会发生什么？" 确立因果关系是政策评估、医学研究和经济分析的终极目标。

潜在结果框架

鲁宾因果模型 (Rubin Causal Model, RCM)，也称潜在结果框架，是现代因果推断的理论基石。对于每个个体 $i$ 和二元处理变量 $D_i \in \{0, 1\}$ ，定义两个潜在结果：

$Y_i(1)$ ：个体 $i$ 接受处理时的结果。
$Y_i(0)$ ：个体 $i$ 未接受处理时的结果。

个体处理效应定义为 $\tau_i = Y_i(1) - Y_i(0)$ 。然而，这是因果推断的根本问题 (Fundamental Problem of Causal Inference)：对于任何一个体，我们只能观测到其中一个潜在结果，而另一个永远是反事实的。观测到的结果可写为：

Y_i = D_i Y_i(1) + (1 - D_i) Y_i(0)

由于无法直接观测个体处理效应，研究者转而估计总体的平均处理效应 (Average Treatment Effect, ATE)：

\tau_{ATE} = \mathbb{E}[Y_i(1) - Y_i(0)]

或处理组的平均处理效应 (Average Treatment Effect on the Treated, ATT)：

\tau_{ATT} = \mathbb{E}[Y_i(1) - Y_i(0) \mid D_i = 1]

识别策略

要使 $\tau_{ATE}$ 可识别，需要满足特定的识别假设。不同的研究设计对应不同的识别策略：

随机对照试验 (RCT)：通过随机分配处理，确保 $D_i \perp\!\!\!\perp (Y_i(0), Y_i(1))$ ，即处理与潜在结果独立。此时简单均值差 $\mathbb{E}[Y_i \mid D_i=1] - \mathbb{E}[Y_i \mid D_i=0]$ 即为 ATE 的一致估计。RCT 被视为因果推断的金标准。
工具变量 (Instrumental Variables, IV)：当处理 $D_i$ 内生时，引入一个与处理相关但与潜在结果无关的工具变量 $Z_i$ 。两阶段最小二乘 (2SLS) 估计局部平均处理效应 (LATE)，即仅对那些因 $Z_i$ 改变而改变处理状态的"依从者" (compliers) 的处理效应。
双重差分 (Difference-in-Differences, DiD)：利用面板数据，比较处理组和对照组在政策前后结果变化的差异。关键假设是平行趋势假设：若无政策干预，两组的结果本会以相同趋势变化。
断点回归 (Regression Discontinuity Design, RDD)：当处理分配由一个连续变量（驱动变量）是否超过某阈值决定时，在阈值附近，处理近似于随机分配，可识别局部因果效应。
匹配方法 (Matching)：假设给定可观测协变量 $X_i$ 后，处理与潜在结果独立（条件独立假设, CIA）。通过倾向得分匹配 (Propensity Score Matching) 等方法，为每个处理个体匹配相似的对照个体。

有向无环图与 do-演算

Judea Pearl 提出的结构因果模型 (Structural Causal Model, SCM) 和有向无环图 (Directed Acyclic Graph, DAG) 提供了另一种表达因果关系的语言。DAG 用节点表示变量，用有向边表示直接的因果关系。通过 $do$ -演算，可以在图形结构中形式化干预操作 $do(X = x)$ ，即强制设定 $X$ 取某个值，并推导在此干预下 $Y$ 的分布 $P(Y \mid do(X = x))$ 。后门准则 (Backdoor Criterion) 和前门准则 (Frontdoor Criterion) 为判断何时可以通过观测数据识别因果效应提供了图形化判据。

格兰杰因果

在时间序列分析中，格兰杰因果 (Granger Causality) 是一种基于预测能力的因果概念：如果 $X$ 的过去值有助于预测 $Y$ 的未来值（在已控制 $Y$ 自身过去值的前提下），则称 $X$ 是 $Y$ 的格兰杰原因。需要注意的是，格兰杰因果不等于真正的结构因果：它捕捉的是时间上的预测关系，而非反事实意义上的因果机制。

经济学中的应用

因果推断方法在经济学中应用广泛：劳动经济学使用 DiD 和 IV 研究教育和培训的回报；发展经济学依赖 RCT 评估扶贫项目的效果；健康经济学利用 RDD 研究医保政策的影响。近年来，"可信度革命" (Credibility Revolution) 强调研究设计在因果识别中的优先性，推动了经济学从依赖结构性假设转向更加透明的准实验方法。

因果关系的建立需要理论、研究设计和统计方法的有机结合，是现代实证科学中最具挑战性也最为核心的任务之一。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。