ARTICLE
识别
识别 (Identification) 在计量经济学和统计学中,识别 (Identification) 是一个基础概念,关注的核心问题是:能否从可观测数据中唯一地推断出模型中未知参数的真实值。如果参数可识别,意味着理论上拥有足够多的数据就能确定其真值;反之,无论数据量多大都无法确定。识别是关于模型设定和理论可能性的问题,先于任何估计过程。 识别问题的直观例子
识别 (Identification)
在计量经济学和统计学中,识别 (Identification) 是一个基础概念,关注的核心问题是:能否从可观测数据中唯一地推断出模型中未知参数的真实值。如果参数可识别,意味着理论上拥有足够多的数据就能确定其真值;反之,无论数据量多大都无法确定。识别是关于模型设定和理论可能性的问题,先于任何估计过程。
识别问题的直观例子
经典的供求模型可帮助理解。假设需求方程 ,供给方程 ,市场出清 。我们只能观测到均衡点 ,但两个方程形式相同——观测点同时满足两式,无法区分。多种不同的参数值可生成完全相同的数据模式,这种现象称为观测等价性 (Observational Equivalence)。因此,模型中参数是不可识别的。
实现识别的条件
引入额外信息(约束)可解决识别问题。在联立方程模型中,常用剔除约束 (exclusion restrictions)。
阶条件 (Order Condition)(必要):设系统有 个外生变量、 个内生变量。方程 包含 个外生变量和 个内生变量,阶条件要求 ,即被排除的外生变量数不少于右侧内生变量数。
秩条件 (Rank Condition)(充分必要):被方程排除的变量在其他方程中的系数矩阵的秩必须等于 ,确保这些"工具"有效且非冗余。
识别的三种状态
根据阶条件和秩条件,方程识别状态分为三类:
- 不可识别 (Unidentified/Underidentified):阶条件不满足 (),无法得到参数的一致估计,估计结果无意义。
- 恰好识别 (Exactly Identified):阶条件等式成立 () 且秩条件满足,参数有唯一解,可用间接最小二乘法 (ILS) 或两阶段最小二乘法 (2SLS) 估计。
- 过度识别 (Overidentified):阶条件严格不等式成立 () 且秩条件满足,工具变量数量超过所需最小值。可用2SLS估计,并可进行Sargan-Hansen检验验证模型设定的有效性。
供求模型再考察
回到供求模型。假设消费者收入 影响需求但不影响供给:需求方程 ,供给方程 。系统中 为内生变量, 为外生变量。
供给方程排除 (,),阶条件满足,且 时秩条件满足,因此供给方程恰好识别——收入变动使需求曲线移动,在稳定供给曲线上滑动描绘出其形状。而需求方程包含全部外生变量(),阶条件不满足,不可识别。若要识别需求方程,需引入影响供给但不影响需求的外生变量(如工资 ),使两方程均成为恰好识别。
广义视角
识别概念超越联立方程模型,是因果推断 (Causal Inference) 的核心。工具变量法 (IV)、断点回归 (RDD)、双重差分法 (DID) 等现代计量方法本质都是精巧的识别策略 (Identification Strategy)——寻找外生性变动以克服内生性问题,从而识别因果效应。识别迫使研究者在接触数据前深入思考模型的内在逻辑,明确"我们究竟能从数据中学到什么"。它是连接经济理论与经验证据的桥梁。