ARTICLE

球形假设

球形假设(Sphericity Assumption)是重复测量方差分析(Repeated Measures ANOVA)中最核心也最容易被忽视的前提条件。它要求各次重复测量之间的差异分数满足方差齐性——即任意两个时间点的测量值之差的方差在整个试验范围内保持恒定。若球形假设成立,重复测量ANOVA的F检验统计量精确服从F分布,推断结果可靠;一旦违背,第一类错

浏览 0 更新 2025-11-09

球形假设(Sphericity Assumption)是重复测量方差分析(Repeated Measures ANOVA)中最核心也最容易被忽视的前提条件。它要求各次重复测量之间的差异分数满足方差齐性——即任意两个时间点的测量值之差的方差在整个试验范围内保持恒定。若球形假设成立,重复测量ANOVA的FF检验统计量精确服从FF分布,推断结果可靠;一旦违背,第一类错误率将大幅膨胀。为此,统计学家先后发展了马氏球形检验与格林豪斯–盖瑟校正等配套工具,使球形假设成为纵向数据分析中不可绕过的方法论门槛。

一、数学定义

球形假设的严格数学表述涉及协方差矩阵的结构。设有kk次重复测量(即kk个处理水平),随机向量X=(X1,X2,,Xk)\mathbf{X} = (X_1, X_2, \dots, X_k)^{\top}的协方差矩阵为Σ\mathbf{\Sigma}。球形假设要求:对于任意两个不同的处理水平iijj,差值XiXjX_i - X_j的方差为常数。令C\mathbf{C}为任意(k1)×k(k-1) \times k的正交对比矩阵,其各行向量相互正交且与全1向量正交,则球形假设等价于:

CΣC=σ2Ik1\mathbf{C\Sigma C}^{\top} = \sigma^2 \mathbf{I}_{k-1}

其中σ2>0\sigma^2 > 0为公共方差,Ik1\mathbf{I}_{k-1}(k1)(k-1)阶单位矩阵。这一条件意味着对比变量之间方差相等且互不相关。另一种等价表述是:球形假设要求协方差矩阵的所有特征值在除去第一个最大特征值后完全相等。从几何角度看,若球形假设成立,处理水平的对比向量在(k1)(k-1)维空间中的散布呈现球对称形态,"球形假设"因此得名。

球形假设与复合对称性(Compound Symmetry)存在密切联系。复合对称性要求协方差矩阵的所有对角元素相等(即各次测量的方差相同),所有非对角元素也相等(即各对测量之间的协方差相同)。复合对称性蕴含球形假设,但反向却不成立——球形假设比复合对称性更为宽松。例如,当协方差矩阵具有AR(1)\text{AR}(1)结构时,球形假设可能仍然成立,而复合对称性却已失效。这一区别在实际数据分析中十分关键。

二、马氏球形检验

马氏球形检验(Mauchly's Test of Sphericity)是目前最常用的球形假设检验方法,由约翰·马赫利于1940年提出。该检验的零假设为协方差矩阵满足球形条件,备择假设为不满足。检验统计量的构造基于样本协方差矩阵S\mathbf{S}与球形条件的偏离程度。令NN为样本量,kk为重复测量水平数,马氏统计量WW定义为:

W=CSC[tr(CSC)/(k1)]k1W = \frac{|\mathbf{C S C}^{\top}|}{[\text{tr}(\mathbf{C S C}^{\top})/(k-1)]^{k-1}}

WW趋近于1时,数据与球形假设高度一致;WW接近于0时,偏离严重。在大样本下,NlnW-N \ln W近似服从自由度为(k1)(k+2)/21(k-1)(k+2)/2 - 1的卡方分布,据此可计算pp值以判断是否拒绝零假设。

马氏球形检验存在两项显著缺陷。其一,在小样本情况下,检验的功效较低,容易将实质偏离误判为满足球形假设;而在大样本情况下,即使微小的偏离也会导致拒绝零假设,此时校正方法比检验结果更为重要。其二,该检验对正态性偏离高度敏感——当数据分布尾部较重或存在异常值时,检验的实际第一类错误率远高于名义水平。因此,研究者不应机械地依赖马氏检验的结果,而应结合效应量指标(如格林豪斯–盖瑟的ε\varepsilon)综合判断偏离程度。

三、偏离的后果

当球形假设被违反时,重复测量ANOVA的FF检验将产生偏倚。具体而言,方差分析中FF统计量的分子均方(处理效应)与分母均方(误差项)的比值不再服从中心FF分布,导致实际第一类错误率远高于预设的显著性水平α\alpha。模拟研究表明,当球形偏离严重时,实际第一类错误率可高达0.30甚至更高,使得大量虚假的"显著差异"涌入文献。这一问题的根源在于重复测量设计中被试内误差项在各处理水平间存在相关,而传统ANOVA模型假设各观测值独立。

球形假设的偏离程度可通过ε\varepsilon(Epsilon)指标量化。当ε=1\varepsilon = 1时,球形假设完全成立;当ε<1\varepsilon < 1时,存在偏离,ε\varepsilon值越小偏离越严重。ε\varepsilon的下界为1/(k1)1/(k-1),对应最极端的不均匀协方差结构——此时重复测量ANOVA高度不可靠。了解ε\varepsilon值有助于判断偏离的严重性并选择合适的校正方法。

四、校正方法

当球形假设不成立时,研究者可从两个方向寻求解决方案。第一类方法是调整FF检验的自由度,降低显著性检验的临界值以控制第一类错误率;第二类方法是采用结构更为灵活的统计模型,不依赖球形假设。

格林豪斯–盖瑟校正(Greenhouse–Geisser Correction)是最常用的调整方法。该方法先利用样本协方差矩阵估算ε\varepsilon值(记作ε^\hat{\varepsilon}),然后将FF检验的分子自由度与分母自由度分别乘以此ε^\hat{\varepsilon},参照新的自由度查表确定临界值。当ε^\hat{\varepsilon}较小时,校正后的自由度大幅缩减,检验更加保守。该方法的缺陷在于偏保守——在样本量较小时,ε^\hat{\varepsilon}的系统性低估会使校正后的检验功效下降。

赫因–费尔特校正(Huynh–Feldt Correction)是对格林豪斯–盖瑟方法的改进。赫因–费尔特提出修正估值ε~\tilde{\varepsilon},在保持无偏性的同时减小了低估幅度。实际应用中,研究者通常同时报告两种校正的结果,若两种校正均显示显著,则可放心报告显著效应。此外,当ε^>0.75\hat{\varepsilon} > 0.75时,赫因–费尔特校正更为可取;当ε^0.75\hat{\varepsilon} \leq 0.75时,格林豪斯–盖瑟校正更为保守稳健。

多层次模型(Multilevel Model)或混合效应模型(Mixed-Effects Model)代表了超越球形假设的现代分析路径。这类方法通过为每个被试随机截距和随机斜率建模,直接刻画重复测量之间的相关结构,而无需假定所有差值方差相等。在贝叶斯框架下,还可进一步引入先验信息对协方差矩阵施加正则化约束,使推断更具弹性。

五、应用注意事项

在实际应用中,正确应对球形假设需要研究者建立三步方法意识。第一步,在分析之前明确研究设计中的重复测量层次:有两个以上处理水平的被试内因素需要重点考察球形假设,而只有两个水平的被试内因素(差值只有一个)则天然满足球形假设,无需检验。第二步,运行重复测量ANOVA时自动请求马氏球形检验及两种校正输出,借助ε^\hat{\varepsilon}值判断偏离的严重程度。第三步,根据偏离情况选择报告未校正的FF值(球形成立)或校正后的pp值(球形不成立),并在论文中说明校正方法的选择依据。

在软件操作层面,SPSS在重复测量ANOVA中会自动输出马氏检验结果与两种校正系数;R语言中,\texttt{car}包的\texttt{Anova()}函数配合\texttt{anova\_test()}同样提供完整的球形检验与校正功能;Python的\texttt{statsmodels}模块也支持相关分析。研究者应养成查看校正结果的习惯,而非仅仅关注原始的FF统计量。

球形假设虽以"假设"命名,但其方法论意义远超一项统计前提。它是连接古典方差分析与现代混合效应模型的思维枢纽,提醒研究者:重复测量数据的内在相关结构不容忽视。正确理解并灵活应对球形假设,是在纵向数据分析中做出可靠推断的必修功课。