ARTICLE

Causality

因果性 (Causality) 因果性（Causality）指一个事件、过程或变量（因）对另一个事件、过程或变量（果）所产生的实质性影响。在经济学与统计学中，因果性区别于纯粹的相关性：相关性描述两个变量共同变动的统计模式，而因果性要求确立从原因到结果的方向性作用机制。因果推断（Causal Inference）是现代实证经济学、流行病学、政策评估和机器学习领

浏览 4 更新 2025-10-26

因果性 (Causality)

因果性（Causality）指一个事件、过程或变量（因）对另一个事件、过程或变量（果）所产生的实质性影响。在经济学与统计学中，因果性区别于纯粹的相关性：相关性描述两个变量共同变动的统计模式，而因果性要求确立从原因到结果的方向性作用机制。因果推断（Causal Inference）是现代实证经济学、流行病学、政策评估和机器学习领域的核心方法论，其目标是从观测数据或实验数据中识别并估计因果效应的方向和大小。

潜在结果框架

鲁宾因果模型（Rubin Causal Model, RCM），亦称潜在结果框架（Potential Outcomes Framework），由Jerzy Neyman（1923年）和Donald Rubin（1974年）系统发展，是当代因果推断的理论基石。该框架将因果效应定义为同一单元在接受处理与未接受处理两种反事实情形下结果的差异。

设对于个体 $i$ ，二值处理变量 $D_i \in \{0, 1\}$ ，潜在结果 $Y_i(1)$ 为接受处理时的结果， $Y_i(0)$ 为未接受处理时的结果。个体层面的因果效应为：

\tau_i = Y_i(1) - Y_i(0)

然而，对于任何一个体，我们只能观测到其实际接受处理状态下的结果，无法同时观测到反事实状态的结果——这被称为因果推断的根本问题（Fundamental Problem of Causal Inference）。观测结果可写为：

Y_i = D_i Y_i(1) + (1 - D_i) Y_i(0)

由于个体因果效应不可直接观测，研究通常转向估计平均因果效应（Average Treatment Effect, ATE）：

\tau_{\text{ATE}} = \mathbb{E}[Y_i(1) - Y_i(0)]

以及处理组平均因果效应（ATT）和条件平均因果效应（CATE）等变体。

在随机实验中，处理分配独立于潜在结果 $(Y_i(1), Y_i(0)) \perp\!\!\!\perp D_i$ ，ATE可以通过均值之差一致估计：

\widehat{\tau}_{\text{ATE}} = \bar{Y}_{\text{处理}} - \bar{Y}_{\text{控制}}

但在观测研究中，处理分配通常非随机，需依赖识别策略。

主要识别策略

工具变量法。当存在遗漏变量导致内生性时，工具变量 $Z$ 需满足两个条件：相关性（ $Z$ 与内生变量 $D$ 相关）和外生性（ $Z$ 仅通过 $D$ 影响 $Y$ ，与不可观测因素不相关）。二阶段最小二乘法（2SLS）是经典的IV估计方法，在满足单调性假设时，IV估计量可解释为局部平均处理效应（LATE）——即受工具变量影响的"依从者"（Compliers）群体的平均因果效应。Angrist、Imbens和Rubin对LATE的阐释是因果关系从不可知到可局部识别的关键突破。

双重差分法。双重差分（Difference-in-Differences, DiD）利用面板数据中的时间维度，通过比较处理组与对照组在政策实施前后结果变量的变化来识别因果效应：

\tau_{\text{DiD}} = (\bar{Y}_{\text{处理, 后}} - \bar{Y}_{\text{处理, 前}}) - (\bar{Y}_{\text{控制, 后}} - \bar{Y}_{\text{控制, 前}})

DiD的有效性依赖于平行趋势假设——即若无政策干预，处理组与对照组的结果变化轨迹本应相同。

断点回归。断点回归设计（Regression Discontinuity Design, RDD）利用处理分配在某个连续变量临界值处的非连续性跳跃。若个体在某个"运行变量"达到阈值 $c$ 时概率性地获得处理，且其他特征在 $c$ 附近连续变化，则临界值附近的比较近似于局部随机实验。精确断点回归中，因果效应为：

\tau_{\text{RDD}} = \lim_{x \downarrow c} \mathbb{E}[Y_i \mid X_i = x] - \lim_{x \uparrow c} \mathbb{E}[Y_i \mid X_i = x]

匹配方法。倾向得分匹配（Propensity Score Matching, PSM）基于可观测特征估计每个个体接受处理的概率（倾向得分），将得分相近的处理组与对照组个体配对比较。PSM的有效性依赖于条件独立性假设（CIA），即控制可观测协变量后处理分配独立于潜在结果。当重要混杂因素不可观测时，匹配估计可能仍存在偏误。

格兰杰因果性

格兰杰因果性（Granger Causality）由Clive Granger于1969年提出，是时间序列分析中特有的因果概念。其定义为：若在给定 $Y$ 的过去值后，加入 $X$ 的过去值能显著提升对 $Y$ 的预测精度，则称 $X$ 是 $Y$ 的格兰杰原因。检验通常在VAR模型框架下通过 $F$ 检验进行。需特别强调，格兰杰因果性本质上是预测性概念，并非上述潜在结果框架中的结构因果性——它检验的是时间上的先行-后继关系与预测能力的增量，而非反事实意义上的因果效应。

结构因果模型与有向无环图

Judea Pearl提出的结构因果模型（Structural Causal Model, SCM）提供了因果推断的图形化语言。有向无环图（DAG）用节点表示变量，有向边表示直接的因果作用。通过d-分离（d-Separation）准则，DAG可以系统地判断变量间的条件独立性关系，识别混杂路径、对撞路径和中介路径。Pearl引入的do-算子 $P(Y \mid do(X = x))$ 形式化了干预操作，区分了"观测到 $X = x$ "（条件概率）与"将 $X$ 设定为 $x$ "（干预概率）的本质差异。后门准则（Backdoor Criterion）和前门准则（Frontdoor Criterion）则为从观测数据中识别因果效应提供了系统的图形判定规则。

在经济学中的应用与前沿

因果推断方法深刻重塑了应用经济学的实证范式。劳动经济学中，明瑟方程的回报率估计长期受能力偏误困扰，Angrist与Krueger（1991）使用出生季度作为教育年限的工具变量，开创性地将IV方法引入教育回报领域。发展经济学中，随机对照试验（RCT）的大规模应用——以Duflo、Banerjee和Kremer为代表——使因果识别的内部有效性达到新高度，同时也引发了关于外部有效性和一般均衡效应的持续讨论。产业组织中，Olley-Pakes方法、Levinsohn-Petrin方法等结构估计技术将因果识别与经济学理论模型深度结合。

前沿方向包括：合成控制法在比较案例研究中的应用（如Abadie与Gardeazabal对巴斯克地区恐怖主义经济影响的估计）；因果森林与因果机器学习在高维协变量下的异质性处理效应估计；工具变量的重新阐释与弱工具变量问题的诊断；以及在一般均衡框架下将微观因果估计聚合为宏观政策效应的挑战。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。