ARTICLE

Cochran-Mantel-Haenszel检验

Cochran-Mantel-Haenszel检验 (Cochran-Mantel-Haenszel Test) Cochran-Mantel-Haenszel检验（简称CMH检验），也称Mantel-Haenszel检验或分层卡方检验，是一种用于分析分层二维列联表（stratified 2 2 contingency tables）的非参数统计方法。其核心

浏览 6 更新 2025-11-08

Cochran-Mantel-Haenszel检验 (Cochran-Mantel-Haenszel Test)

Cochran-Mantel-Haenszel检验（简称CMH检验），也称Mantel-Haenszel检验或分层卡方检验，是一种用于分析分层二维列联表（stratified $2 \times 2$ contingency tables）的非参数统计方法。其核心目的是在控制一个或多个混杂变量（分层变量）的前提下，检验两个二分类变量之间是否存在条件独立性。该方法由William Cochran于1954年率先提出分层加权卡方的思想，后由Nathan Mantel与William Haenszel于1959年在癌症流行病学研究中将其系统化并推广，在流行病学、荟萃分析（Meta-analysis）、临床医学及生物统计学中具有极其广泛的应用。

一、问题背景与动机

在实际研究中，研究者常常需要比较两组之间的某种二分类结局（如治疗成功/失败、发病/未发病），但这种比较可能受到第三变量的干扰。例如，在多中心临床试验中，各中心的患者基线特征可能存在差异——病情较重的患者可能集中在部分中心，若直接合并所有数据进行简单的卡方检验，则会因忽略中心效应而产生偏倚，甚至出现方向反转，这就是著名的辛普森悖论（Simpson's Paradox）。

CMH检验通过按分层变量将数据划分为 $K$ 个独立层（strata），在每一层内分别计算关联信息，再以加权方式汇总，从而消除了分层变量的混杂效应，使得最终的统计推断反映的是"在给定分层变量后"两个变量之间的净关联。相较于直接对汇总表进行卡方检验，CMH检验的意义在于：它保证了各层内部的同质性不被跨层差异所污染。

二、数据结构

设有 $K$ 个层（ $k = 1, 2, \ldots, K$ ），每一层内的数据可组织为如下 $2 \times 2$ 列联表：

\begin{tabular}{c|cc|c} \hline 第 $k$ 层 \& 事件发生 \& 事件未发生 \& 合计 \\ \hline 处理组 \& $a_k$ \& $b_k$ \& $n_{1k}$ \\ 对照组 \& $c_k$ \& $d_k$ \& $n_{0k}$ \\ \hline 合计 \& $m_{1k}$ \& $m_{0k}$ \& $N_k$ \\ \hline \end{tabular}

其中 $a_k, b_k, c_k, d_k$ 为第 $k$ 层的四个单元格频数， $N_k = a_k + b_k + c_k + d_k$ 为层总样本量。所有层的行边际 $(n_{1k}, n_{0k})$ 和列边际 $(m_{1k}, m_{0k})$ 被视为固定。每一层内部都构成一个完整的 $2 \times 2$ 表，允许不同层具有不同的样本量和基线风险，这正是CMH方法灵活性的核心来源。

三、检验统计量

CMH检验的核心思想是比较每一层中处理组"事件发生"频数的观察值 $a_k$ 与其在原假设（两变量条件独立）下的期望值。在给定行、列边际的条件下， $a_k$ 服从超几何分布（Hypergeometric Distribution），其期望与方差分别为：

\mathbb{E}[a_k] = \frac{n_{1k} m_{1k}}{N_k}, \qquad \operatorname{Var}(a_k) = \frac{n_{1k} n_{0k} m_{1k} m_{0k}}{N_k^2 (N_k - 1)}

此处，期望值 $\mathbb{E}[a_k]$ 的含义是：若处理与对照确实无任何关联，则在行、列边际固定的前提下，处理组事件发生数的期望恰为行边际与列边际的乘积除以总和。方差项则量化了这一期望的抽样波动。

将所有 $K$ 层汇总，定义：

M = \sum_{k=1}^{K} a_k, \quad \mathbb{E}[M] = \sum_{k=1}^{K} \mathbb{E}[a_k], \quad \operatorname{Var}(M) = \sum_{k=1}^{K} \operatorname{Var}(a_k)

则Cochran-Mantel-Haenszel检验统计量为：

\chi^2_{\text{CMH}} = \frac{\left( \left| \sum_{k=1}^{K} a_k - \sum_{k=1}^{K} \mathbb{E}[a_k] \right| - 0.5 \right)^2}{\sum_{k=1}^{K} \operatorname{Var}(a_k)}

该统计量在原假设下近似服从卡方分布且自由度为 1，即 $\chi^2_{\text{CMH}} \stackrel{H_0}{\sim} \chi^2(1)$ 。公式中的 $-0.5$ 为连续性校正项（Yates校正），用于改善统计量对卡方分布的近似精度；在某些实现（如大多数统计软件默认设置）中可省略该校正项以得到更精确的 $p$ 值，但两种方式在大样本下渐近等价。

四、Mantel-Haenszel公共优势比

与CMH检验一脉相承的核心概念是Mantel-Haenszel公共优势比（Common Odds Ratio），其估计量为：

\hat{\psi}_{\text{MH}} = \frac{\sum_{k=1}^{K} \frac{a_k d_k}{N_k}}{\sum_{k=1}^{K} \frac{b_k c_k}{N_k}}

该估计量假设各层具有相同的真实优势比（即效应同质性假设），并通过对各层的加权平均来消除混杂。其权重 $\frac{1}{N_k}$ 的巧妙之处在于，它赋予样本量较小（因而信息较少）的层较小的权重，赋予样本量较大的层较大的权重，从而在偏差与方差之间达到良好的平衡。

若各层优势比存在显著异质性，则单一公共优势比的汇总可能产生误导，此时应使用Breslow-Day检验或Tarone检验检验层间同质性，或转而采用随机效应模型（如DerSimonian-Laird方法）来放宽同质性假设，允许各层具有不同的真实效应量。

五、关键假设与适用条件

CMH检验的有效性依赖于以下假设：

分层独立性：各层之间相互独立，即不同层的观测互不影响。
边际固定：每层的行列边际被视为给定（在条件推断框架下自然满足）。
效应同质性：当报告公共优势比时，隐含假设各层的真实关联强度相同。若仅进行检验（即仅判断是否存在条件关联），该假设并非必需。
大样本近似： $N_k$ 不必很大，但总样本量 $N = \sum N_k$ 需足够大以保证卡方近似的有效性。一般建议各层期望频数 $\mathbb{E}[a_k]$ 不宜过小，且层数 $K$ 不宜过少。

六、应用与推广

CMH检验最初源于流行病学中的病例对照研究，用于在控制年龄、性别等混杂后评估暴露与疾病的关联。其应用已拓展至：

多中心临床试验：将不同研究中心作为层，汇总治疗效应，消除中心间异质性。
荟萃分析：将不同独立研究作为层，计算合并效应量，对发表偏倚较不敏感。
分层 $R \times C$ 表：广义CMH统计量（Generalized CMH）可处理有序分类或名义多分类变量，此时使用行均值得分统计量、相关统计量与一般关联统计量三个分量，自由度相应变化，覆盖了从有序关联到一般关联的多种备择假设形式。

七、与其他方法的比较

相较于逻辑回归（Logistic Regression），CMH检验的优势在于其非参数性质——无需假设对数线性关系，在小样本或稀疏数据中表现更为稳健。然而，逻辑回归在同时控制多个混杂变量（包括连续变量）以及建模交互效应时更加灵活。实践中，CMH检验常用作初步的、假设宽松的条件独立检验，而逻辑回归用作建模预测与精细调整。两者并非互斥，而是互补——CMH提供稳健的总体检验，逻辑回归则提供系数估计与个体层面的预测。

总之，Cochran-Mantel-Haenszel检验是分层分类数据分析的基石工具，其在统计学与流行病学中的核心地位历经数十年而弥坚。从Cochran最初的洞察到现代广义CMH框架，这一方法始终是处理分层二分类数据时不可或缺的首选检验。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。