ARTICLE

多元方差分析

多元方差分析（Multivariate Analysis of Variance，简称MANOVA）是方差分析（ANOVA）在多因变量情形下的推广。在经典的ANOVA中，研究者考察一个或多个分类自变量对一个连续因变量的影响；而MANOVA则允许同时检验多个连续因变量，考察自变量组间差异在多维因变量上的整体显著性。该方法由统计学家塞缪尔·威尔克斯（Samue

浏览 5 更新 2025-11-08

多元方差分析（Multivariate Analysis of Variance，简称MANOVA） 是方差分析（ANOVA）在多因变量情形下的推广。在经典的ANOVA中，研究者考察一个或多个分类自变量对一个连续因变量的影响；而MANOVA则允许同时检验多个连续因变量，考察自变量组间差异在多维因变量上的整体显著性。该方法由统计学家塞缪尔·威尔克斯（Samuel S. Wilks）在20世纪30年代奠基，随后由哈罗德·霍特林（Harold Hotelling）和罗伯特·C·博斯（R. C. Bose）等人进一步完善，如今已成为实验设计、心理学、教育学、生物医学、工程技术和市场研究等领域不可或缺的分析工具。MANOVA的提出解决了多因变量同时分析的方法论需求，避免了因分别进行多次ANOVA而导致的I类错误膨胀以及忽略因变量间相关结构的信息损失。

基本原理与模型设定

MANOVA的核心思想是将多个因变量视为一个向量，检验不同组别之间该向量的均值是否存在显著差异。假设共有 $k$ 个组（处理水平），每个观测有 $p$ 个因变量，则模型可表示为：

\mathbf{Y}_{ij} = \boldsymbol{\mu} + \boldsymbol{\tau}_i + \boldsymbol{\varepsilon}_{ij}

其中 $\mathbf{Y}_{ij}$ 是第 $i$ 组第 $j$ 个观测的 $p$ 维因变量向量； $\boldsymbol{\mu}$ 是总体均值向量； $\boldsymbol{\tau}_i$ 是第 $i$ 组的处理效应向量； $\boldsymbol{\varepsilon}_{ij}$ 是误差向量，假设其服从多元正态分布 $N_p(\mathbf{0}, \boldsymbol{\Sigma})$ 。

与ANOVA类似，MANOVA将总离差平方和分解为组间离差和组内离差，但此处离差以矩阵形式表示。总离差叉积矩阵（Total Sum of Squares and Cross-Products，简称SSCP）分解为：

\mathbf{T} = \mathbf{B} + \mathbf{W}

其中 $\mathbf{T}$ 为总的SSCP矩阵， $\mathbf{B}$ 为组间SSCP矩阵， $\mathbf{W}$ 为组内（误差）SSCP矩阵。

检验统计量

MANOVA提供多个多元检验统计量，从不同角度衡量组间差异的程度：

威尔克斯Lambda（Wilks' Lambda）：定义为 $\Lambda = |\mathbf{W}| / |\mathbf{T}|$ ，其值介于0和1之间，越接近0表明组间差异越大。该统计量最具历史影响力，在许多软件中作为默认输出。

皮莱迹（Pillai's Trace）：定义为 $\text{Pillai's Trace} = \text{tr}\big(\mathbf{B}(\mathbf{T})^{-1}\big)$ 。当组间差异大时该值趋近于组数减1。皮莱迹对违反多元正态性和方差齐性假设相对稳健，是研究者的推荐选择。

霍特林-劳莱迹（Hotelling-Lawley Trace）：定义为 $\text{Hotelling-Lawley Trace} = \text{tr}\big(\mathbf{B}\mathbf{W}^{-1}\big)$ 。

罗伊最大根（Roy's Largest Root）：取 $\mathbf{B}\mathbf{W}^{-1}$ 的最大特征值，反映单一维度上最大的组间分离程度。

以上统计量均可转换为近似的 $F$ 分布进行显著性检验。当只有一个因变量时（ $p=1$ ），所有统计量退化为ANOVA的 $F$ 检验。

前提假设

MANOVA的统计推断依赖于若干关键假设。第一，各观测应相互独立，这通常通过随机抽样和随机分配来保证。第二，各组的因变量向量应服从多元正态分布，这一假设在高维小样本情形下尤为重要。第三，各组协方差矩阵应满足齐性，即 $\boldsymbol{\Sigma}_1 = \boldsymbol{\Sigma}_2 = \cdots = \boldsymbol{\Sigma}_k$ ，可通过Box's M检验进行评估。第四，因变量间不宜存在极端多重共线性，否则SSCP矩阵可能奇异，导致检验失效。

事后分析与多重比较

当MANOVA整体检验显著时（即组间在多维因变量上存在差异），研究者需进一步探究哪些因变量或哪些组对差异贡献最大。常用的事后分析方法包括：（1）单变量ANOVA（Univariate ANOVA）——对每个因变量单独做ANOVA，但需控制多重比较的I类错误膨胀问题，如采用Bonferroni校正；（2）判别分析（Discriminant Analysis）——通过线性判别函数识别最能区分组别的因变量组合；（3）对比分析（Contrast Analysis）——预先设定感兴趣的组间比较，进行定向检验。

应用示例

假设某教育研究者希望比较三种教学方法（传统讲授、翻转课堂、项目式学习）对学生学业表现的影响。因变量包括期末考试成绩、课堂参与度和学习动机量表得分三个指标。使用MANOVA可同时检验三种方法在这三个因变量上是否存在整体差异。若结果显著（如Wilks' Lambda = 0.62, $p < 0.01$ ），则可进一步进行事后分析，探究具体差异来源于哪些因变量。

MANOVA与ANOVA的比较

相较于分别进行多次ANOVA，MANOVA具有以下优点：（1）能够捕捉因变量之间的相关性，发现单变量分析无法揭示的整体模式；（2）在因变量间存在中等程度相关时，MANOVA比多次ANOVA具有更高的统计检验力；（3）从整体上控制I类错误率，避免多重比较带来的膨胀问题。然而，MANOVA对假设违反较为敏感，且结果解释比ANOVA更为复杂，因此研究者应在充分理解假设条件和研究问题的基础上谨慎选用。

软件实现

目前主流统计软件均支持MANOVA。在SPSS中可通过「General Linear Model → Multivariate」菜单实现；R语言中可使用 \texttt{manova()} 函数或 \texttt{car} 包的 \texttt{Manova()} 函数，后者额外提供类型II和类型III的平方和计算；Python的 \texttt{statsmodels} 库提供 \texttt{MANOVA} 类，结合 \texttt{pandas} 的数据框接口可便捷完成分析；Stata则通过 \texttt{manova} 命令实现，支持多元对比检验。此外，SAS的 \texttt{PROC GLM} 和 \texttt{PROC ANOVA} 均可输出MANOVA结果。JMP和Minitab等图形化统计软件同样提供MANOVA的菜单式操作，降低了使用门槛。

局限性与注意事项

尽管MANOVA功能强大，但在实际应用中需要注意若干局限性。首先，当因变量数量较多时（如 $p > 5-10$ ），统计检验力会显著下降，且结果解释变得困难，此时应考虑降维方法如主成分分析（PCA）作为预处理步骤。其次，MANOVA要求数据完整，缺失值的存在会导致整个观测被剔除（列表删除），在大样本情境下可能造成信息浪费，可考虑多重插补等方法弥补。第三，MANOVA的显著结果仅表明组间存在差异，但无法直接指明具体差异方向，需要结合事后分析和效应量指标（如偏 $\eta^2$ ）进行综合判断。常用的效应量度量包括广义 $\eta^2$ 和多元 $\eta^2$ ，它们衡量的是自变量对因变量集合的整体解释力度。

与结构方程模型的联系

MANOVA与结构方程模型（SEM）中的均值结构检验存在密切联系。在SEM框架下，研究者可以通过多组验证性因子分析检验组间潜均值的等值性，这可以视为MANOVA在潜变量层面的推广。相比于MANOVA，SEM方法允许测量误差的校正，并提供更灵活的模型约束和拟合优度检验。近年来的方法学文献还发展了非参数和基于排名的多元检验方法，如多元Kruskal-Wallis检验和PERMANOVA（基于距离的多元方差分析），后者不依赖多元正态性假设，适用于生态学和高维生物数据。

综上所述，多元方差分析是多因变量实验设计中不可或缺的统计方法之一，能够在考虑因变量间相关结构的前提下，对组间差异进行整体检验，为复杂问题的统计推断提供坚实的方法学支撑。研究者应当根据数据特点（如分布形态、样本量、因变量个数）和研究目标审慎选择适当的多元检验统计量和事后分析方法，确保结论的可靠性和可重复性。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。