ARTICLE

混合模型

混合模型 (Mixed Model) 混合模型 (Mixed Model) 是统计学与计量经济学中一类同时包含固定效应 (Fixed Effects) 和随机效应 (Random Effects) 的回归模型。与仅含固定效应的经典线性回归不同,混合模型允许截距或斜率系数在分组单位之间随机变化,从而能够同时建模总体平均效应和群体异质性。该模型在面板数据分析、多

浏览 0 更新 2025-12-20

混合模型 (Mixed Model)

混合模型 (Mixed Model) 是统计学计量经济学中一类同时包含固定效应 (Fixed Effects) 和随机效应 (Random Effects) 的回归模型。与仅含固定效应的经典线性回归不同,混合模型允许截距或斜率系数在分组单位之间随机变化,从而能够同时建模总体平均效应和群体异质性。该模型在面板数据分析、多层次数据结构及重复测量实验中有广泛应用。

模型结构

考虑一个基本的线性混合模型 (Linear Mixed Model, LMM)。对于第 jj 个分组(如个体、学校、地区)中的第 ii 个观测:

yij=xijβ+zijuj+εijy_{ij} = \mathbf{x}_{ij}^{\top} \boldsymbol{\beta} + \mathbf{z}_{ij}^{\top} \mathbf{u}_j + \varepsilon_{ij}

其中:

  • β\boldsymbol{\beta} 是固定效应系数向量,描述总体层面的平均效应;
  • ujN(0,Σu)\mathbf{u}_j \sim \mathcal{N}(\mathbf{0}, \boldsymbol{\Sigma}_u) 是随机效应向量,捕捉第 jj 组的特异性偏离;
  • εijN(0,σε2)\varepsilon_{ij} \sim \mathcal{N}(0, \sigma^2_\varepsilon) 是观测水平的独立误差;
  • xij\mathbf{x}_{ij}zij\mathbf{z}_{ij} 分别是固定效应与随机效应的设计向量,二者可以重叠。

模型的方差分量分解为组间方差 Σu\boldsymbol{\Sigma}_u 和组内方差 σε2\sigma^2_\varepsilon,总协方差结构为:

Cov(yj)=ZjΣuZj+σε2I\mathrm{Cov}(\mathbf{y}_j) = \mathbf{Z}_j \boldsymbol{\Sigma}_u \mathbf{Z}_j^{\top} + \sigma^2_\varepsilon \mathbf{I}

固定效应与随机效应的区分

选择固定效应还是随机效应取决于研究目标和数据结构:

固定效应适用于推断兴趣集中在特定水平(如比较特定几种处理方案)的情境,或当分组数量较少且各组可被视为总体全部时。固定效应估计对各组内变异加权,不依赖组间信息。

随机效应适用于分组是从一个更大总体中随机抽取的情境(如抽样调查中的聚类),或研究目标在于推断总体方差结构时。随机效应通过"借力" (borrowing strength) 机制——利用组间信息对组内估计进行收缩估计——使得小样本组的估计更加稳健。

Hausman 检验是区分二者的经典工具:在零假设下随机效应估计量一致且有效,备择假设下仅固定效应一致。

估计方法

混合模型的参数估计主要依赖两种框架:

一、最大似然估计 (MLE):对 β\boldsymbol{\beta}Σu\boldsymbol{\Sigma}_uσε2\sigma^2_\varepsilon 同时最大化似然函数。MLE 在估计方差分量时存在小样本向下偏误,因为它未考虑固定效应估计所消耗的自由度。

二、限制最大似然 (REML):先通过线性变换消除固定效应,再对剩余对比最大化似然。REML 对方差分量的估计具有更小偏误,是实际应用中的推荐默认方法。

对于随机效应的预测,使用最佳线性无偏预测 (BLUP):

u~j=ΣuZjVj1(yjXjβ^)\tilde{\mathbf{u}}_j = \boldsymbol{\Sigma}_u \mathbf{Z}_j^{\top} \mathbf{V}_j^{-1} (\mathbf{y}_j - \mathbf{X}_j \hat{\boldsymbol{\beta}})

其中 Vj=ZjΣuZj+σε2I\mathbf{V}_j = \mathbf{Z}_j \boldsymbol{\Sigma}_u \mathbf{Z}_j^{\top} + \sigma^2_\varepsilon \mathbf{I}。BLUP 是收缩估计量:当组内样本量小或组间方差相对较小时,随机效应预测向零(总体均值)收缩。

扩展与变体

广义线性混合模型 (GLMM):当响应变量不服从正态分布时(如二分类、计数数据),引入链接函数和指数族分布:

g(E[yijuj])=xijβ+zijujg(\mathbb{E}[y_{ij} \mid \mathbf{u}_j]) = \mathbf{x}_{ij}^{\top} \boldsymbol{\beta} + \mathbf{z}_{ij}^{\top} \mathbf{u}_j

其估计通常通过 Laplace 近似或自适应高斯求积实现,计算强度远高于 LMM。

非线性混合模型 (NLMM):固定效应和随机效应以非线性形式进入模型,在药物动力学和生长曲线建模中常见。

潜在类别混合模型:将有限混合与随机效应结合,允许群体中存在不可观测的亚类,每个亚类具有不同的随机效应分布。

在经济学中的应用

混合模型在实证经济学中扮演关键角色。教育生产函数中,学生嵌套于班级、班级嵌套于学校的多层结构天然适合混合模型——学校层面的随机截距可以捕捉校园文化和资源禀赋的未观测异质性。劳动经济学中,个体跨时期的追踪数据使用随机效应模型分解持久性能力和时变冲击。发展经济学中,跨国面板数据的随机系数模型允许增长收敛速度在国家间存在异质性。

混合模型也与贝叶斯统计有天然联系:随机效应分布可视为参数的先验分布,BLUP 等价于后验均值,这种层次先验结构使得贝叶斯混合模型在多层数据分析中具有方法学上的统一性。

与固定效应模型的比较

混合模型与纯固定效应模型(如组内估计量或 LSDV)在方法论上存在根本差异。固定效应模型将组别虚拟变量直接纳入回归,消耗大量自由度,且仅能估计组内效应——不随时间变化的变量(如性别、种族)的系数无法识别。混合模型则通过将个体异质性建模为随机变量,保留了时不变变量的估计能力。

然而这种效率的提升以更强的假设为代价:随机效应必须与回归元不相关。当这一假设不成立时,随机效应估计量是不一致的,而固定效应估计量始终一致。这一权衡由Hausman检验形式化:检验统计量比较两种估计量的差异,显著差异意味着随机效应假设被拒绝。在实际应用中,许多经验研究者默认使用固定效应设定作为稳健策略,仅在明确通过 Hausman 检验后才转向随机效应。

混合模型的另一优势在于预测。固定效应模型仅能估计已观测组的效应,而混合模型的随机效应框架允许对未观测组进行预测——这对抽样推断和小域估计至关重要。

注意事项

尽管灵活,混合模型对分布假设敏感。随机效应的正态性假设不成立时,方差分量估计和 BLUP 都可能偏离。此外,当随机效应与回归元相关时(即违反外生性假定),应优先使用固定效应设定或 Hausman-Taylor 类型的工具变量方法。

在模型选择方面,似然比检验和AICBIC 等信息准则可用于比较嵌套或非嵌套的方差结构,但需注意方差分量在边界上的非正则检验问题(如检验 σu2=0\sigma^2_u = 0 时,零假设落在参数空间边界)。此外,对于多层次数据,需谨慎指定随机效应的结构:随机截距模型假定组间差异仅体现在基线水平,而随机系数模型允许解释变量的效应在组间变化。过度参数化的随机效应结构可能导致收敛失败或方差分量的不可识别。