ARTICLE

元分析

元分析 (Meta-Analysis) 元分析 (Meta-Analysis) 是一套用于对多个独立但相关的实证研究结果进行定量整合与统计合并的系统性方法。其核心目标在于通过增大有效样本量来提高统计功效,解决单个研究因样本量有限而结论不一致的问题,从而得出比任何单一研究都更稳健、更精确的综合效应估计。该术语由Glass于1976年正式提出,但其方法论内核可追

浏览 5 更新 2025-10-26

元分析 (Meta-Analysis)

元分析 (Meta-Analysis) 是一套用于对多个独立但相关的实证研究结果进行定量整合统计合并的系统性方法。其核心目标在于通过增大有效样本量来提高统计功效,解决单个研究因样本量有限而结论不一致的问题,从而得出比任何单一研究都更稳健、更精确的综合效应估计。该术语由Glass于1976年正式提出,但其方法论内核可追溯至20世纪初费雪合并p值的工作以及皮尔逊的相关性合并技术。元分析在循证医学心理学教育经济学劳动经济学中已成为证据综合的金标准。

核心概念:效应量

元分析的起点是效应量(Effect Size),一个反映干预效果或关联强度的标准化度量,使不同研究即使度量尺度不同、设计不同也具有可比性。常用效应量包括:

  • 标准化均值差:Cohen's d、Hedges' g(小样本校正版),用于比较处理组与对照组的连续型结果,以0.2、0.5、0.8界定小、中、大效应。
  • 相关系数:如皮尔逊相关系数r,经Fisher's z变换后合并,广泛用于观测性研究和关联分析。
  • 比值指标:对数优势比、对数风险比、对数相对风险,在医学和流行病学中最常用。
  • 标准化回归系数:不同研究报告的同一解释变量的效应因模型设定差异而不可直接比较,元分析可对其标准化后加权合并。

固定效应模型与随机效应模型

元分析的核心统计决策在于选择合并模型。固定效应模型假设所有研究估计的是同一个真效应值,研究间变异性仅来自抽样误差:yi=θ+εiy_i = \theta + \varepsilon_i,其中εiN(0,σi2)\varepsilon_i \sim N(0, \sigma_i^2)。加权方式为逆方差加权,权重wi=1/σi2w_i = 1/\sigma_i^2,综合效应θ^FE=wiyiwi\hat{\theta}_{FE} = \frac{\sum w_i y_i}{\sum w_i}

随机效应模型允许不同的真实效应值,假设研究效应来自正态分布:yi=θi+εiy_i = \theta_i + \varepsilon_i,其中θiN(μ,τ2)\theta_i \sim N(\mu, \tau^2)τ2\tau^2为研究间方差。权重调整为wi=1/(σi2+τ^2)w_i^* = 1/(\sigma_i^2 + \hat{\tau}^2),综合效应μ^RE=wiyiwi\hat{\mu}_{RE} = \frac{\sum w_i^* y_i}{\sum w_i^*}。该方法更现实地承认研究间固有的异质性,置信区间通常更宽。经典的DerSimonian-Laird方法通过矩估计获得τ^2\hat{\tau}^2

异质性与出版物偏倚

异质性检验是元分析中必不可少的诊断环节。Cochran's Q统计量检验研究效应是否完全同质;I2I^2统计量衡量由真正差异引起的变异性占比:I2=(Qdf)/Q×100%I^2 = (Q - df)/Q \times 100\%,以25%25\%50%50\%75%75\%为低、中、高界值。若异质性较高,应进行亚组分析元回归探索异质性来源。

出版物偏倚指显著结果更易发表导致的系统性偏差。检测方法包括:漏斗图(效应量为横轴、标准误为纵轴,不对称提示偏倚);Egger's回归检验;以及剪补法估计并填补可能遗漏的研究以校正综合效应。

应用与局限

元分析在劳动经济学中用于合并多个工具变量研究或随机对照试验的处理效应,典型案例为CardKrueger对最低工资效应的大规模综述。在教育经济学中,元分析系统评估缩小班级规模等措施对学业成绩的平均影响。

核心局限包括:只能综合已有研究,无法纠正原始研究的系统性偏误(废进废出);异质性严重时合并单一点估计可能误导政策推断;研究的选择过程若存在主观性将降低可重复性。PRISMA声明为元分析的报告透明化提供了标准框架,要求明确披露检索策略、纳入排除标准及偏倚风险评估过程。