ARTICLE
不一致
不一致 (Inconsistency) 不一致(Inconsistency)是计量经济学和统计学中描述估计量大样本性质的核心概念。若一个估计量 _n 在样本容量 n 趋于无穷大时,其概率极限(probability limit, plim)不等于待估参数的真实值 _0,则称该估计量是不一致的(inconsistent)。换言之,不一致意味着无论收集多少数据,
不一致 (Inconsistency)
不一致(Inconsistency)是计量经济学和统计学中描述估计量大样本性质的核心概念。若一个估计量 在样本容量 趋于无穷大时,其概率极限(probability limit, plim)不等于待估参数的真实值 ,则称该估计量是不一致的(inconsistent)。换言之,不一致意味着无论收集多少数据,估计量都无法收敛到真实参数值。这一性质与一致性(Consistency)正相对:一致性要求 ,而不一致则是这一条件的违反。
不一致与偏误(Bias)既有联系又有本质区别:偏误是固定样本容量下期望的偏差(),属于有限样本性质;而不一致是渐近性质,涉及概率极限而非期望。一个估计量可能在小样本中有偏但在大样本中一致(如最大似然估计量在正则条件下渐进无偏且一致),亦可能在有限样本中无偏却在渐近意义上不一致(当方差发散或分布发生渐近位移时)。均方误(MSE)准则同时纳入了偏误和方差,一致性本质上要求偏误和方差均趋于零。
不一致的主要来源
在经典线性回归模型 中,OLS估计量 一致的充分必要条件是 ,这要求外生性条件 或至少 。当这一条件被违反时,OLS估计量将不一致。常见场景包括:
遗漏变量偏误
当真实模型包含但估计模型遗漏了一个与解释变量相关的变量时,OLS估计量产生不一致性。设真实模型为 ,且 与 相关,则遗漏 后的估计量 满足 。遗漏变量偏误的方向由 和 的符号共同决定。这一机制在劳动经济学中的经典案例是明瑟方程中遗漏能力变量对教育回报率的向上偏误。
测量误差
当解释变量存在经典测量误差(classical measurement errors)时,即观测值 ,其中测量误差 与真实值 和误差项 均不相关,OLS估计量将向零衰减(attenuation bias)。具体而言,,衰减因子等于信噪比。当被解释变量存在测量误差时,若误差与回归元不相关,OLS仍一致但效率降低;若相关则导致不一致。
联立性偏误
在联立方程模型(simultaneous equations models)中,内生解释变量与误差项同期相关。设,且由模型系统内部决定,则 必然与 相关,OLS估计量不一致。经典例子包括:在供求模型中直接用OLS估计需求价格弹性,因价格与需求扰动相关而得到有偏且不一致的结果。工具变量法(IV/2SLS)是解决这类不一致的标准方法。
自回归模型中的滞后因变量
在动态面板模型 中,若使用固定效应估计量(Fixed Effects estimator),由于组内变换后 与 相关,在 固定的渐近框架下估计量不一致——这一发现被称为Nickell偏误(Nickell, 1981)。Arellano-Bond估计量(差分GMM)通过使用滞后水平值作为差分方程的工具变量来解决这一问题。
选择偏误与样本截断
当样本非随机选择且选择规则与模型误差项相关时,OLS产生不一致。例如赫克曼选择模型(Heckman selection model):若仅对观测到工资的个体估计工资方程,而就业决策与潜在工资相关,则OLS估计量不一致。赫克曼两步法(Heckman correction)通过估计逆米尔斯比率来修正这一偏误。
弱工具变量
在IV估计中,若工具变量与内生变量仅微弱相关(弱工具变量),即使工具变量满足外生性,IV估计量的有限样本偏误可能很大,且渐近近似不佳。Bound, Jaeger \& Baker (1995) 指出弱工具变量导致IV估计量逼近OLS估计量,从而无法消除不一致性。
不一致的诊断与应对
检测不一致的一般策略包括:Durbin-Wu-Hausman检验(DWH检验)比较一致估计量(如IV)和潜在不一致估计量(如OLS)的差异,若差异显著则拒绝外生性原假设。过度识别检验(Sargan/Hansen J检验)用于评估工具变量的有效性。霍斯曼检验(Hausman test)在面板数据中用于区分固定效应和随机效应模型,其逻辑同样基于一致性的对比。
解决不一致的典型方法包括:使用工具变量(IV/2SLS)处理内生性;引入面板数据方法(固定效应、差分GMM、系统GMM)控制不可观测异质性;采用极大似然估计(MLE)在正确设定的参数模型下获得一致估计;应用广义矩方法(GMM)在矩条件成立时实现一致性;以及利用实验方法(随机对照试验、自然实验、断点回归)创造外生变异。
不一致与渐进理论的关系
不一致性是大样本理论关注的核心问题之一。从渐近理论的角度看,一个不一致的估计量可能在如下意义上失败:均方一致性(MSE consistency)要求 ;依概率收敛要求 ;依分布收敛到退化的分布集中于错误参数值。当这些条件被违反时,统计推断(置信区间、假设检验)将失效——中心极限定理仍然成立,但收敛的目标不是真实参数值。
值得注意的是,不一致并非总是灾难性的:在某些高维或非参数设定中,估计量可能以低于参数收敛速度的速率保持一致(即慢速一致),但仍可提供有用的信息;收缩估计量(如James-Stein估计量)在均方误意义下优于MLE,但可能是渐近有偏的;正则化方法(LASSO、岭回归)通过引入偏误来降低方差,在稀疏模型下仍可实现变量选择的一致性。
总之,不保持一致性的核心判断标准为:随着样本量增长,估计量的概率极限是否偏离真实参数值。识别不一致的来源、选择合适的识别策略,是实证研究中保证结论可信度的基石。