ARTICLE

有限信息最大似然估计

有限信息最大似然估计 (Limited Information Maximum Likelihood) 有限信息最大似然估计（Limited Information Maximum Likelihood，简称 LIML），又称最小方差比估计（Least Variance Ratio Estimator），是计量经济学中用于估计联立方程模型中单个结构方程的一种

浏览 0 更新 2025-11-10

有限信息最大似然估计 (Limited Information Maximum Likelihood)

有限信息最大似然估计（Limited Information Maximum Likelihood，简称 LIML），又称最小方差比估计（Least Variance Ratio Estimator），是计量经济学中用于估计联立方程模型中单个结构方程的一种经典方法。该方法由安德森（T. W. Anderson）和鲁宾（H. Rubin）于1949年首次提出，此后与两阶段最小二乘法（2SLS）一同成为联立方程估计的核心工具。LIML的核心理念是：在估计某一特定结构方程时，仅使用该方程所包含的信息（即方程中出现的变量信息），而不利用整个系统中其他方程的完整结构信息——由此得名「有限信息」。与之相对的是完全信息最大似然估计（Full Information Maximum Likelihood, FIML），后者同时估计系统中的所有方程，效率更高但计算负担也更重。

历史背景

LIML的诞生与联立方程模型的经典争论密不可分。20世纪中叶，以哈维尔莫（Trygve Haavelmo）和库普曼斯（Tjalling Koopmans）为代表的考尔斯委员会（Cowles Commission）系统发展了一套同时方程组的经济计量理论。哈维尔莫因在计量经济学方法论上的开创性贡献于1989年获得诺贝尔经济学奖。安德森与鲁宾在此框架下提出LIML，旨在解决需求-供给系统中结构方程的识别和估计问题。在计算资源极其有限的年代，LIML的最大似然求解面临较大计算瓶颈，而后来由泰尔（Henri Theil）于1958年提出的2SLS由于计算简便迅速普及。然而，随着弱工具变量问题在实证研究中受到广泛重视，LIML在20世纪90年代后重新获得学术界的关注。

方法与直觉

考虑联立方程系统中需要估计的某一结构方程：

y = Y_1\beta + X_1\gamma + \epsilon

其中 $y$ 是内生变量， $Y_1$ 是方程右侧的其他内生变量， $X_1$ 是方程中的外生变量。由于 $Y_1$ 与 $\epsilon$ 相关，直接使用普通最小二乘法（OLS）会产生不一致的估计。

LIML的基本思路如下。令 $X_2$ 为系统中被排除在该方程之外的外生变量（即工具变量），并令 $X = [X_1, X_2]$ 为所有外生变量构成的矩阵。对于任意候选的系数向量 $(\beta, \gamma)$ ，计算两个残差平方和：一是 $y - Y_1\beta - X_1\gamma$ 对 $X_1$ 回归的残差平方和（记为 $RSS_U$ ），二是该残差对全部 $X$ 回归的残差平方和（记为 $RSS_R$ ）。LIML选择使二者的方差比（Variance Ratio）

\lambda(\beta, \gamma) = \frac{RSS_U}{RSS_R}

达到最小的参数值作为估计量。换言之，LIML寻找一组系数，使得使用所有外生变量预测的残差相对于仅使用方程内变量预测的残差具有最大的解释力提升。这一直觉与工具变量方法的内核高度一致：工具变量的有效性体现在其能够提供外生变异来解释内生变量的变动。

这一优化问题最终归结为求解一个广义特征值问题。设 $W = [Y_1, X_1]$ 为方程右侧全部变量， $M_{X_1}$ 和 $M_X$ 分别为对 $X_1$ 和 $X$ 的投影残差算子，则问题转化为求解特征方程 $\det(\lambda W'M_X W - W'M_{X_1}W) = 0$ ，其最小特征值对应的特征向量即为LIML估计量。这一代数结构使得LIML的数值求解可借助标准的特征值算法完成，无需进行非线性数值优化。

LIML与2SLS的关系

LIML与2SLS在渐近意义上是等价的——两者在大样本下具有相同的渐近分布，都是一致且渐近正态的估计量。然而，二者在有限样本性质上存在重要差异，这种差异在弱工具变量情境下尤为突出。

从代数视角看，LIML属于k类估计量（k-class estimators）家族。k类估计量的统一表达式为 $\hat{\beta}_k = (Y_1'(I - kM_X)Y_1)^{-1}Y_1'(I - kM_X)y$ ，其中2SLS对应 $k = 1$ ，而LIML对应 $k = 1 - \lambda_{\min}/n$ ， $\lambda_{\min}$ 是前述方差比的最小值。由于 $\lambda_{\min}$ 通常介于0与1之间，LIML的k值略大于1。这一差异在普通样本中微乎其微，但在弱工具变量情境下至关重要——正是这一微小的调整使得LIML在弱识别时仍能保持中位数无偏的性质。

有限样本性质

与2SLS相比，LIML在弱工具变量情境下表现更为稳健。当工具变量与内生变量的相关性较弱时，2SLS的有限样本偏差会趋于向普通最小二乘法（OLS）的方向偏倚，且其渐近分布理论可能严重失效。而LIML在弱工具变量下仍能保持近似中位数无偏的性质，相应的置信区间覆盖率也更接近名义水平。这是LIML在现代应用中最重要的优势，也是它在实证研究中持续受到青睐的根本原因。

然而，LIML也存在明显的局限性。其一，LIML的矩条件存在截断问题：当方程的过度识别阶数（degree of overidentification）为 $m$ 时，LIML的前 $m$ 阶矩存在，但更高阶矩不存在。这意味着当过度识别阶数较低时，LIML甚至不存在有限的均值，导致其有限样本方差可能极大且存在异常值问题。其二，在某些极端样本中，方差比的最小特征值可能小于1，使得 $k < 1$ ，此时LIML的有限样本性质反而劣于2SLS。

现代应用与推广

在现代计量经济学中，LIML作为弱工具变量稳健估计的代表性方法，在实证经济学中仍有广泛应用。常见的应用场景包括增长经济学中的跨国增长回归、劳动经济学中的教育回报率估计、以及金融经济学中的资产定价模型检验等。在实证研究中，研究者常同时汇报2SLS和LIML的估计结果，若两者差异显著，则通常暗示存在弱工具变量问题，需要谨慎解释结论。

LIML的后续理论推广丰富而多样。完全信息最大似然估计（FIML）将有限信息扩展到整个联立方程系统，利用系统的完整结构信息提高估计效率。连续更新估计量（Continuously Updated Estimator, CUE）则在广义矩估计（GMM）框架下推广了LIML的稳健性思想，具有与LIML类似的弱工具变量稳健性。此外，利用LIML构造的安德森-鲁宾检验（Anderson-Rubin Test）在弱工具变量下仍能保持正确的检验水平，是工具变量推断中不可或缺的稳健工具。这些方法共同构成了计量经济学中处理内生性问题的完整工具箱。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。