ARTICLE

Cochran-Mantel-Haenszel检验

Cochran-Mantel-Haenszel检验 (Cochran-Mantel-Haenszel Test) Cochran-Mantel-Haenszel检验(简称CMH检验),也称Mantel-Haenszel检验或分层卡方检验,是一种用于分析分层二维列联表(stratified 2 2 contingency tables)的非参数统计方法。其核心

浏览 6 更新 2025-11-08

Cochran-Mantel-Haenszel检验 (Cochran-Mantel-Haenszel Test)

Cochran-Mantel-Haenszel检验(简称CMH检验),也称Mantel-Haenszel检验分层卡方检验,是一种用于分析分层二维列联表(stratified 2×22 \times 2 contingency tables)的非参数统计方法。其核心目的是在控制一个或多个混杂变量(分层变量)的前提下,检验两个二分类变量之间是否存在条件独立性。该方法由William Cochran于1954年率先提出分层加权卡方的思想,后由Nathan Mantel与William Haenszel于1959年在癌症流行病学研究中将其系统化并推广,在流行病学荟萃分析(Meta-analysis)、临床医学生物统计学中具有极其广泛的应用。

一、问题背景与动机

在实际研究中,研究者常常需要比较两组之间的某种二分类结局(如治疗成功/失败、发病/未发病),但这种比较可能受到第三变量的干扰。例如,在多中心临床试验中,各中心的患者基线特征可能存在差异——病情较重的患者可能集中在部分中心,若直接合并所有数据进行简单的卡方检验,则会因忽略中心效应而产生偏倚,甚至出现方向反转,这就是著名的辛普森悖论(Simpson's Paradox)。

CMH检验通过按分层变量将数据划分为 KK 个独立层(strata),在每一层内分别计算关联信息,再以加权方式汇总,从而消除了分层变量的混杂效应,使得最终的统计推断反映的是"在给定分层变量后"两个变量之间的净关联。相较于直接对汇总表进行卡方检验,CMH检验的意义在于:它保证了各层内部的同质性不被跨层差异所污染。

二、数据结构

设有 KK 个层(k=1,2,,Kk = 1, 2, \ldots, K),每一层内的数据可组织为如下 2×22 \times 2 列联表:

\begin{tabular}{c|cc|c} \hline 第 kk 层 \& 事件发生 \& 事件未发生 \& 合计 \\ \hline 处理组 \& aka_k \& bkb_k \& n1kn_{1k} \\ 对照组 \& ckc_k \& dkd_k \& n0kn_{0k} \\ \hline 合计 \& m1km_{1k} \& m0km_{0k} \& NkN_k \\ \hline \end{tabular}

其中 ak,bk,ck,dka_k, b_k, c_k, d_k 为第 kk 层的四个单元格频数,Nk=ak+bk+ck+dkN_k = a_k + b_k + c_k + d_k 为层总样本量。所有层的行边际 (n1k,n0k)(n_{1k}, n_{0k}) 和列边际 (m1k,m0k)(m_{1k}, m_{0k}) 被视为固定。每一层内部都构成一个完整的 2×22 \times 2 表,允许不同层具有不同的样本量和基线风险,这正是CMH方法灵活性的核心来源。

三、检验统计量

CMH检验的核心思想是比较每一层中处理组"事件发生"频数的观察值 aka_k 与其在原假设(两变量条件独立)下的期望值。在给定行、列边际的条件下,aka_k 服从超几何分布(Hypergeometric Distribution),其期望与方差分别为:

E[ak]=n1km1kNk,Var(ak)=n1kn0km1km0kNk2(Nk1)\mathbb{E}[a_k] = \frac{n_{1k} m_{1k}}{N_k}, \qquad \operatorname{Var}(a_k) = \frac{n_{1k} n_{0k} m_{1k} m_{0k}}{N_k^2 (N_k - 1)}

此处,期望值 E[ak]\mathbb{E}[a_k] 的含义是:若处理与对照确实无任何关联,则在行、列边际固定的前提下,处理组事件发生数的期望恰为行边际与列边际的乘积除以总和。方差项则量化了这一期望的抽样波动。

将所有 KK 层汇总,定义:

M=k=1Kak,E[M]=k=1KE[ak],Var(M)=k=1KVar(ak)M = \sum_{k=1}^{K} a_k, \quad \mathbb{E}[M] = \sum_{k=1}^{K} \mathbb{E}[a_k], \quad \operatorname{Var}(M) = \sum_{k=1}^{K} \operatorname{Var}(a_k)

Cochran-Mantel-Haenszel检验统计量为:

χCMH2=(k=1Kakk=1KE[ak]0.5)2k=1KVar(ak)\chi^2_{\text{CMH}} = \frac{\left( \left| \sum_{k=1}^{K} a_k - \sum_{k=1}^{K} \mathbb{E}[a_k] \right| - 0.5 \right)^2}{\sum_{k=1}^{K} \operatorname{Var}(a_k)}

该统计量在原假设下近似服从卡方分布且自由度为 1,即 χCMH2H0χ2(1)\chi^2_{\text{CMH}} \stackrel{H_0}{\sim} \chi^2(1)。公式中的 0.5-0.5 为连续性校正项(Yates校正),用于改善统计量对卡方分布的近似精度;在某些实现(如大多数统计软件默认设置)中可省略该校正项以得到更精确的 pp 值,但两种方式在大样本下渐近等价。

四、Mantel-Haenszel公共优势比

与CMH检验一脉相承的核心概念是Mantel-Haenszel公共优势比(Common Odds Ratio),其估计量为:

ψ^MH=k=1KakdkNkk=1KbkckNk\hat{\psi}_{\text{MH}} = \frac{\sum_{k=1}^{K} \frac{a_k d_k}{N_k}}{\sum_{k=1}^{K} \frac{b_k c_k}{N_k}}

该估计量假设各层具有相同的真实优势比(即效应同质性假设),并通过对各层的加权平均来消除混杂。其权重 1Nk\frac{1}{N_k} 的巧妙之处在于,它赋予样本量较小(因而信息较少)的层较小的权重,赋予样本量较大的层较大的权重,从而在偏差与方差之间达到良好的平衡。

若各层优势比存在显著异质性,则单一公共优势比的汇总可能产生误导,此时应使用Breslow-Day检验Tarone检验检验层间同质性,或转而采用随机效应模型(如DerSimonian-Laird方法)来放宽同质性假设,允许各层具有不同的真实效应量。

五、关键假设与适用条件

CMH检验的有效性依赖于以下假设:

  1. 分层独立性:各层之间相互独立,即不同层的观测互不影响。
  2. 边际固定:每层的行列边际被视为给定(在条件推断框架下自然满足)。
  3. 效应同质性:当报告公共优势比时,隐含假设各层的真实关联强度相同。若仅进行检验(即仅判断是否存在条件关联),该假设并非必需。
  4. 大样本近似NkN_k 不必很大,但总样本量 N=NkN = \sum N_k 需足够大以保证卡方近似的有效性。一般建议各层期望频数 E[ak]\mathbb{E}[a_k] 不宜过小,且层数 KK 不宜过少。

六、应用与推广

CMH检验最初源于流行病学中的病例对照研究,用于在控制年龄、性别等混杂后评估暴露与疾病的关联。其应用已拓展至:

  • 多中心临床试验:将不同研究中心作为层,汇总治疗效应,消除中心间异质性。
  • 荟萃分析:将不同独立研究作为层,计算合并效应量,对发表偏倚较不敏感。
  • 分层 R×CR \times C:广义CMH统计量(Generalized CMH)可处理有序分类或名义多分类变量,此时使用行均值得分统计量相关统计量一般关联统计量三个分量,自由度相应变化,覆盖了从有序关联到一般关联的多种备择假设形式。

七、与其他方法的比较

相较于逻辑回归(Logistic Regression),CMH检验的优势在于其非参数性质——无需假设对数线性关系,在小样本或稀疏数据中表现更为稳健。然而,逻辑回归在同时控制多个混杂变量(包括连续变量)以及建模交互效应时更加灵活。实践中,CMH检验常用作初步的、假设宽松的条件独立检验,而逻辑回归用作建模预测与精细调整。两者并非互斥,而是互补——CMH提供稳健的总体检验,逻辑回归则提供系数估计与个体层面的预测。

总之,Cochran-Mantel-Haenszel检验是分层分类数据分析的基石工具,其在统计学与流行病学中的核心地位历经数十年而弥坚。从Cochran最初的洞察到现代广义CMH框架,这一方法始终是处理分层二分类数据时不可或缺的首选检验。