ARTICLE
Endogenous Variable
内生变量 (Endogenous Variable) 内生变量(Endogenous Variable)是计量经济学和经济模型中的核心概念,指在一个经济系统或统计模型中由系统内部机制所决定的变量,即在均衡条件下从模型内部推导出来的变量。内生变量与外生变量(Exogenous Variable)相对——后者由模型外部的因素决定,不受模型内其他变量的反馈影响。在
内生变量 (Endogenous Variable)
内生变量(Endogenous Variable)是计量经济学和经济模型中的核心概念,指在一个经济系统或统计模型中由系统内部机制所决定的变量,即在均衡条件下从模型内部推导出来的变量。内生变量与外生变量(Exogenous Variable)相对——后者由模型外部的因素决定,不受模型内其他变量的反馈影响。在计量回归框架下,若一个解释变量与误差项相关(),则称该变量为内生变量。内生性的存在违背了普通最小二乘法(OLS)的经典假设,导致OLS估计量失去一致性,这是实证研究中必须严肃对待的根本性挑战。
内生性的三大来源
内生性通常来自以下三种机制,理解其来源是选择恰当修正方法的前提:
- 遗漏变量偏误(Omitted Variable Bias)。当影响被解释变量并与某个解释变量相关的因素未被纳入回归模型时,该遗漏变量的效应被错误地归因于已包含的解释变量,导致后者与误差项产生相关性。例如,估计"教育→工资"时若不控制能力(Ability),能力同时影响教育选择和工资水平,则教育变量内生。
- 测量误差(Measurement Error)。当解释变量以含有噪声的方式被测量时(),观测值与真实值的偏差 进入误差项,导致解释变量与回归残差相关。经典的"衰减偏误"(Attenuation Bias)即由此产生:在简单线性回归中,系数的OLS估计量依概率收敛于 ,绝对值朝向零偏误。
- 联立性偏误(Simultaneity Bias / Reverse Causality)。当解释变量与被解释变量之间存在双向因果关系时,内生性不可避免。典型例子是价格与数量的供需均衡:价格影响需求量,需求量反过来又影响价格。将价格直接回归于数量(或反之)将得到供需曲线的混合而非任一单条曲线。又如犯罪率与警力投入:警力投入影响犯罪率,但高犯罪率地区也会雇用更多警察。
内生性对OLS的后果
在存在内生性的条件下,OLS估计量不再具有一致性和无偏性。考虑真实模型 ,OLS估计量的概率极限为:
只要 ,OLS估计量就渐近偏离真实参数 ,偏差的方向和幅度取决于协方差的符号和大小。即使样本容量趋于无穷,偏误也不会消失——这使得基于OLS的统计推断和假设检验完全失效。更糟糕的是,内生性偏误的方向通常可以根据经济理论预测,但不能仅通过数据本身"检测"出来,这使得诊断内生性成为实证研究的核心难题。
内生性的处理方法
计量经济学发展了一系列应对内生性的方法,按策略可归纳为以下几类:
- 工具变量法(Instrumental Variables, IV)与两阶段最小二乘法(2SLS)。寻找一个与内生变量相关、与误差项无关的工具变量 ,通过两阶段程序提取内生变量中的外生变异。相关性保证第一阶段的有效性(经验法则:第一阶段F统计量 > 10),外生性保证估计量的一致性。这是应用经济学中处理内生性最广泛使用的范式。
- 面板数据方法。当内生性来自不随时间变化的遗漏变量时,固定效应模型(Fixed Effects)通过对个体均值做离差变换消除个体异质性。一阶差分(First Differences)是另一种消除时不变遗漏变量的常用策略。若内生性随时间变化,则可结合工具变量使用动态面板GMM方法(Arellano-Bond估计量)。
- 自然实验与准实验方法。利用政策变化、制度特征或地理断点等外生冲击识别因果效应。具体方法包括双重差分法(Difference-in-Differences)、断点回归设计(Regression Discontinuity Design)和合成控制法(Synthetic Control Method)。这些方法不依赖传统工具变量的排他性假设,而是在特定的识别假设下利用自然变异识别因果效应。
- 结构模型方法。从经济理论出发,完整写出联立方程组,通过最大似然估计(MLE)或广义矩估计(GMM)对整个系统进行联合估计。结构方法的优势在于透明地刻画内生性的理论来源,代价是对模型设定较为敏感。
内生性的诊断检验
Hausman检验是检验内生性是否存在的最经典方法。其核心思想是:在无内生性的原假设下,OLS和IV估计量都应一致,但OLS更有效;若两者差异显著,则表明存在内生性。检验统计量为:
此外,过度识别约束检验(Sargan-Hansen J检验)用于评估工具变量的外生性:当工具变量数量超过内生变量数量时,可检验所有工具变量是否均与误差项无关。弱工具变量检验(第一阶段F统计量)则是诊断工具变量相关性的必要步骤,Stock-Yogo临界值表为判断弱工具变量的严重程度提供了标准。
经济学中的经典案例
内生性问题遍及经济学各个子领域。在劳动经济学中,教育回报率的估计长期受能力偏误困扰:Angrist和Krueger(1991)以出生季度作为工具变量,利用义务教育法造成的入学年龄差异识别教育的因果回报。在发展经济学中,Acemoglu、Johnson和Robinson(2001)以殖民者死亡率作为制度的工具变量,估计制度质量对长期经济增长的因果效应——这一经典研究深刻体现了内生制度与经济发展之间的联立性难题。在健康经济学中,医疗支出与健康结果的双向因果关系使简单的OLS回归无法识别的医疗边际效用。在金融学中,公司治理结构与公司业绩之间存在着典型的反向因果:好的治理提升业绩,但业绩好的公司也有更多资源改善治理结构。这些案例说明,识别并处理内生性不仅是计量技术的选择,更是研究设计层面的核心问题——找到可信的外生变异来源往往比精深的估计技术更为关键。