ARTICLE

连续更新GMM

连续更新GMM（Continuously Updated GMM，CUE-GMM）是广义矩估计（GMM）框架中的一种重要估计策略，由汉森（Hansen）、希顿（Heaton）和亚龙（Yaron）于1996年系统提出。与标准的两步GMM不同，连续更新GMM的核心特征在于将权重矩阵视为待估参数的函数，在最小化过程中对权重矩阵与参数向量同时进行连续迭代，直至收敛。

浏览 0 更新 2025-11-11

连续更新GMM（Continuously Updated GMM，CUE-GMM）是广义矩估计（GMM）框架中的一种重要估计策略，由汉森（Hansen）、希顿（Heaton）和亚龙（Yaron）于1996年系统提出。与标准的两步GMM不同，连续更新GMM的核心特征在于将权重矩阵视为待估参数的函数，在最小化过程中对权重矩阵与参数向量同时进行连续迭代，直至收敛。这一方法在有限样本性质、弱识别情境下的稳健性以及数值稳定性方面具有独特优势，成为现代计量经济学工具箱中的重要组成部分。

估计原理与构造

在标准GMM框架中，设 $g_t(\theta)$ 为 $m$ 维矩条件向量，满足总体矩条件 $E[g_t(\theta_0)] = 0$ 。GMM估计量通过最小化以下目标函数获得：

Q_T(\theta) = \left[\frac{1}{T}\sum_{t=1}^T g_t(\theta)\right]' W_T(\theta) \left[\frac{1}{T}\sum_{t=1}^T g_t(\theta)\right]

在两步GMM中，权重矩阵 $W_T$ 的选取分两步完成：首先使用一个初始权重矩阵（如单位矩阵）获得一致但非有效的估计量 $\tilde{\theta}$ ，然后基于 $\tilde{\theta}$ 计算最优权重矩阵 $\hat{W}_T = \hat{S}^{-1}$ （其中 $\hat{S}$ 是矩条件的协方差矩阵的一致估计），最后以此固定权重矩阵重新估计 $\theta$ 。

连续更新GMM则取消了这一分步程序：它将权重矩阵直接构造为参数 $\theta$ 的函数 $W_T(\theta) = \hat{S}(\theta)^{-1}$ ，其中 $\hat{S}(\theta)$ 是在给定 $\theta$ 下对矩条件长期协方差矩阵的估计。目标函数变为：

Q_T^{\text{CUE}}(\theta) = \left[\frac{1}{T}\sum_{t=1}^T g_t(\theta)\right]' \hat{S}(\theta)^{-1} \left[\frac{1}{T}\sum_{t=1}^T g_t(\theta)\right]

估计量 $\hat{\theta}_{\text{CUE}}$ 通过直接最小化上述目标函数得出。在数值实现上，这一最小化通常需要借助迭代优化算法，因为参数 $\theta$ 同时出现在样本矩和权重矩阵之中，目标函数不再具有简单的二次型结构。

渐近性质

连续更新GMM估计量在标准正则条件下具有与最优两步GMM相同的渐近分布。具体而言， $\hat{\theta}_{\text{CUE}}$ 是 $\sqrt{T}$ -一致估计量，且满足：

\sqrt{T}(\hat{\theta}_{\text{CUE}} - \theta_0) \xrightarrow{d} N(0, (G' S^{-1} G)^{-1})

其中 $G = E[\partial g_t(\theta_0)/\partial \theta']$ 为矩条件的期望导数矩阵， $S = \lim_{T \to \infty} \text{Var}(\sqrt{T} \bar{g}_T(\theta_0))$ 为矩条件的渐近方差协方差矩阵。这一结果表明，CUE在渐近意义下与最优两步GMM具有相同的效率，两者均达到半参数效率下界。

然而，CUE在有限样本中的表现往往显著优于两步GMM。这一优势主要源于两个方面：其一，CUE的目标函数对参数估计的误差更为"平滑"，避免了两步估计中因权重矩阵的随机波动而产生的额外变异性；其二，CUE对矩条件的等距变换具有不变性，而两步GMM缺乏这一理想性质。

弱识别情境下的优势

连续更新GMM最引人注目的优势体现在弱识别（weak identification）情境中。当矩条件对参数的识别力度较弱时（即导数矩阵 $G$ 接近秩亏缺），两步GMM的有限样本性质急剧恶化：估计量可能出现严重偏误，置信区间覆盖率远低于名义水平，过度识别检验的尺寸扭曲严重。相比之下，CUE在这一情境下表现出明显的稳健性。

这一差异的直觉在于：在弱识别条件下，两步GMM的权重矩阵估计误差与样本矩的波动相互耦合，导致目标函数在参数空间中产生虚假的最小值。而CUE通过将权重矩阵内生化于目标函数中，有效抑制了这种耦合效应。Stock和Wright（2000）以及Kleibergen（2005）的研究表明，基于CUE的识别检验（如Kleibergen的K统计量）在弱识别下具有正确的渐近尺寸，而标准的两步GMM过度识别检验则存在严重的尺寸扭曲。

与广义经验似然的关系

连续更新GMM与广义经验似然（Generalized Empirical Likelihood, GEL）估计量家族之间存在深刻的联系。GEL类估计量包括经验似然（Empirical Likelihood, EL）、指数倾斜经验似然（Exponential Tilting, ET）和连续更新GMM本身。事实上，CUE可被视为GEL框架中采用二次型准则函数的一个特例。Newey和Smith（2004）在统一的GEL框架下系统比较了这些估计量的高阶渐近性质，发现CUE在偏差项中不包含由矩条件非线性程度引起的额外成分，这一性质使其在某些情境下具有比经验似然更优的高阶偏差表现。

计算问题与发展

CUE在计算上面临比两步GMM更大的挑战。目标函数 $Q_T^{\text{CUE}}(\theta)$ 可能具有多个局部极小值，且在弱识别区域中目标函数可能非常平坦，这对全局优化算法提出了较高要求。实际应用中通常采用以下策略：使用多个起始值进行全局搜索；结合两步GMM估计量作为初始值；利用剖面似然技巧降低优化维度。

近年来，连续更新GMM在资产定价、宏观经济学和劳动经济学等领域得到了广泛应用。在资产定价中，CUE常用于估计随机贴现因子模型的参数，因为这类模型通常面临矩条件众多而识别强度不足的问题；在宏观经济学中，CUE被应用于估计结构性消费资本资产定价模型和货币政策的泰勒规则。此外，CUE的思想也已拓展至面板数据模型和动态结构模型的估计中，成为处理弱识别问题的标准工具之一。

有限样本表现的比较

大量蒙特卡洛模拟研究对连续更新GMM与两步GMM的有限样本表现进行了系统比较。在矩条件数目较多而样本量有限的情形中，两步GMM的有限样本偏误随矩条件数量的增加而迅速增大，这一现象被称为"矩条件偏误"。CUE由于避免了权重矩阵的预估计误差积累，其偏误增长幅度明显更小。此外，在重尾分布或存在异常值的数据环境中，CUE的目标函数对极端观测值的敏感度较低，因而表现出更强的稳健性。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。