ARTICLE
自我选择
自我选择 (Self-Selection) 自我选择(Self-Selection)是微观经济学、劳动经济学和计量经济学中的核心概念,指个体基于自身特征、偏好或预期收益,主动选择进入某一群体、状态或处理组的行为。与随机实验中被动的随机分配不同,自我选择意味着个体的决策是内生的——这种内生性会系统性地扭曲统计推断,产生自我选择偏误(Self-Selection
自我选择 (Self-Selection)
自我选择(Self-Selection)是微观经济学、劳动经济学和计量经济学中的核心概念,指个体基于自身特征、偏好或预期收益,主动选择进入某一群体、状态或处理组的行为。与随机实验中被动的随机分配不同,自我选择意味着个体的决策是内生的——这种内生性会系统性地扭曲统计推断,产生自我选择偏误(Self-Selection Bias)。该概念在政策评估、劳动力市场分析和教育回报估计中具有根本性意义,因为几乎所有观测性数据都涉及某种程度的自我选择。
自我选择偏误的经典表述
自我选择偏误的核心在于:当个体根据其潜在结果(Potential Outcomes)选择是否接受处理时,处理组和控制组在可观测及不可观测特征上均存在系统性差异。以教育回报估计为例:选择接受高等教育的人可能在能力、动机或家庭背景上与未接受高等教育的人不同,而这些特征本身也会影响收入。因此,简单比较两组人的平均工资差异,无法识别教育的因果效应——差异中混杂了能力偏误(Ability Bias)。
形式上,令 和 分别表示个体 接受处理和未接受处理的潜在结果, 为处理状态。当 取决于 的个体预期值时,朴素比较 不再等于平均处理效应(ATE),而等于处理组平均处理效应(ATT)加上一个选择偏误项。
罗伊模型 (Roy Model)
罗伊模型(Roy, 1951)是分析自我选择行为的奠基性框架。该模型描述了个体如何在两个或多个部门(如不同职业)之间进行自我选择:每个个体都知道自己在各部门的潜在收入,并选择能使自身收入最大化的部门。模型揭示了一个关键洞见——个体并非随机分配到各部门,而是基于比较优势进行排序。由此产生的选择可以是正向的(高能力者进入高回报部门)或负向的,取决于各部门回报结构的协方差。
赫克曼修正 (Heckman Correction)
詹姆斯·赫克曼(James Heckman, 1979)因解决自我选择偏误问题而获得诺贝尔经济学奖。其赫克曼两步法(Heckman Two-Step)开创性地将选择过程建模为样本选择问题:第一步,用 Probit 模型估计个体进入处理组的概率,并计算逆米尔斯比率(Inverse Mills Ratio, );第二步,将 作为额外回归元加入结果方程,从而纠正选择性偏误。该方法的识别依赖于排除性约束——至少需要一个影响选择但不直接影响结果的工具变量。
应用与政策含义
自我选择的概念深刻影响着实证研究的策略选择。在项目评估中,工具变量法、双重差分(DID)、断点回归设计(RDD)和倾向得分匹配(PSM)等方法均在不同假设下试图处理自我选择带来的内生性问题。在保险市场中,自我选择体现为逆向选择——高风险个体更倾向于购买保险,导致市场失灵。在劳动经济学中,女性的劳动参与决策存在显著的自我选择,忽视这一选择会严重低估性别工资差距。
此外,在医疗经济学中,患者对治疗方案的选择并非随机——更健康的患者可能更积极地寻求治疗,若忽视这一自我选择,会高估治疗效果。类似地,在企业培训项目评估中,自愿参加培训的员工往往本身更具上进心,简单的受训-未受训比较会高估培训回报。现代实证研究日益依赖随机对照试验(RCT)来消除自我选择偏误,但当 RCT 不可行或不 ethically 允许时,准实验方法仍是应对自我选择的主要工具。
理解自我选择是区分相关与因果的第一步。对于研究者和政策制定者而言,意识到数据中个体并非随机分布,而是主动选择了其所在的位置,是做出有效推断和正确决策的前提。