ARTICLE

识别

识别 (Identification) 在计量经济学和统计学中,识别 (Identification) 是一个基础概念,关注的核心问题是:能否从可观测数据中唯一地推断出模型中未知参数的真实值。如果参数可识别,意味着理论上拥有足够多的数据就能确定其真值;反之,无论数据量多大都无法确定。识别是关于模型设定和理论可能性的问题,先于任何估计过程。 识别问题的直观例子

浏览 29 更新 2025-10-25

识别 (Identification)

计量经济学统计学中,识别 (Identification) 是一个基础概念,关注的核心问题是:能否从可观测数据中唯一地推断出模型中未知参数的真实值。如果参数可识别,意味着理论上拥有足够多的数据就能确定其真值;反之,无论数据量多大都无法确定。识别是关于模型设定和理论可能性的问题,先于任何估计过程。

识别问题的直观例子

经典的供求模型可帮助理解。假设需求方程 Qd=α0+α1P+ud Q^d = \alpha_0 + \alpha_1 P + u_d ,供给方程 Qs=β0+β1P+us Q^s = \beta_0 + \beta_1 P + u_s ,市场出清 Qd=Qs=Q Q^d = Q^s = Q 。我们只能观测到均衡点 (Q,P) (Q, P) ,但两个方程形式相同——观测点同时满足两式,无法区分。多种不同的参数值可生成完全相同的数据模式,这种现象称为观测等价性 (Observational Equivalence)。因此,模型中参数是不可识别的

实现识别的条件

引入额外信息(约束)可解决识别问题。在联立方程模型中,常用剔除约束 (exclusion restrictions)

阶条件 (Order Condition)(必要):设系统有 K K 个外生变量、M M 个内生变量。方程 i i 包含 Ki K_i 个外生变量和 Mi M_i 个内生变量,阶条件要求 KKiMi1 K - K_i \ge M_i - 1 ,即被排除的外生变量数不少于右侧内生变量数。

秩条件 (Rank Condition)(充分必要):被方程排除的变量在其他方程中的系数矩阵的必须等于 M1 M-1 ,确保这些"工具"有效且非冗余。

识别的三种状态

根据阶条件和秩条件,方程识别状态分为三类:

  1. 不可识别 (Unidentified/Underidentified):阶条件不满足 (KKi<Mi1 K - K_i < M_i - 1 ),无法得到参数的一致估计,估计结果无意义。
  2. 恰好识别 (Exactly Identified):阶条件等式成立 (KKi=Mi1 K - K_i = M_i - 1 ) 且秩条件满足,参数有唯一解,可用间接最小二乘法 (ILS) 或两阶段最小二乘法 (2SLS) 估计。
  3. 过度识别 (Overidentified):阶条件严格不等式成立 (KKi>Mi1 K - K_i > M_i - 1 ) 且秩条件满足,工具变量数量超过所需最小值。可用2SLS估计,并可进行Sargan-Hansen检验验证模型设定的有效性。

供求模型再考察

回到供求模型。假设消费者收入 I I 影响需求但不影响供给:需求方程 Q=α0+α1P+α2I+ud Q = \alpha_0 + \alpha_1 P + \alpha_2 I + u_d ,供给方程 Q=β0+β1P+us Q = \beta_0 + \beta_1 P + u_s 。系统中 Q,P Q, P 为内生变量,I I 为外生变量。

供给方程排除 I I KKi=1 K-K_i=1 Mi1=1 M_i-1=1 ),阶条件满足,且 α20 \alpha_2 \ne 0 时秩条件满足,因此供给方程恰好识别——收入变动使需求曲线移动,在稳定供给曲线上滑动描绘出其形状。而需求方程包含全部外生变量(KKi=0 K-K_i=0 ),阶条件不满足,不可识别。若要识别需求方程,需引入影响供给但不影响需求的外生变量(如工资 W W ),使两方程均成为恰好识别。

广义视角

识别概念超越联立方程模型,是因果推断 (Causal Inference) 的核心。工具变量法 (IV)、断点回归 (RDD)、双重差分法 (DID) 等现代计量方法本质都是精巧的识别策略 (Identification Strategy)——寻找外生性变动以克服内生性问题,从而识别因果效应。识别迫使研究者在接触数据前深入思考模型的内在逻辑,明确"我们究竟能从数据中学到什么"。它是连接经济理论与经验证据的桥梁。