ARTICLE

Cochran定理

Cochran定理 (Cochran's Theorem) Cochran定理→数理统计核心定理→处理正态分布随机向量的二次型分解→由William G. Cochran于1934年提出→奠定了ANOVA、F检验和一般线性模型推断的理论根基。该定理回答如下基本问题:若服从多元正态分布的随机向量其平方和可分解为若干非负二次型之和,这些二次型何时相互独立且分别服

浏览 0 更新 2025-07-16

Cochran定理 (Cochran's Theorem)

Cochran定理数理统计核心定理→处理正态分布随机向量的二次型分解→由William G. Cochran于1934年提出→奠定了ANOVAF检验和一般线性模型推断的理论根基。该定理回答如下基本问题:若服从多元正态分布的随机向量其平方和可分解为若干非负二次型之和,这些二次型何时相互独立且分别服从卡方分布?答案是当且仅当各二次型矩阵幂等且秩之和等于总自由度。

定理陈述

设随机向量X=(X1,,Xn)N(0,In)\mathbf{X}=(X_1,\dots,X_n)'\sim N(\mathbf{0},\mathbf{I}_n),即各分量独立同分布于标准正态分布。若存在kkn×nn\times n实对称矩阵A1,,Ak\mathbf{A}_1,\dots,\mathbf{A}_k满足:

XX=i=1kXAiX,XAiX0,\mathbf{X}'\mathbf{X} = \sum_{i=1}^{k} \mathbf{X}'\mathbf{A}_i\mathbf{X}, \quad \mathbf{X}'\mathbf{A}_i\mathbf{X} \geq 0,

则以下三个条件等价:

  1. 诸二次型XAiX\mathbf{X}'\mathbf{A}_i\mathbf{X}相互独立,且XAiXχri2\mathbf{X}'\mathbf{A}_i\mathbf{X}\sim\chi^2_{r_i},其中ri=rank(Ai)r_i=\operatorname{rank}(\mathbf{A}_i)
  2. Ai\mathbf{A}_i幂等矩阵,即Ai2=Ai\mathbf{A}_i^2=\mathbf{A}_i
  3. i=1kri=n\sum_{i=1}^{k} r_i = n

推广至一般协方差矩阵的情形:若XN(μ,σ2In)\mathbf{X}\sim N(\boldsymbol{\mu},\sigma^2\mathbf{I}_n),则在Ai\mathbf{A}_i幂等且秩和等于nn的条件下,各1σ2XAiX\frac{1}{\sigma^2}\mathbf{X}'\mathbf{A}_i\mathbf{X}服从非中心卡方分布,非中心参数取决于均值向量μ\boldsymbol{\mu},且二次型之间仍然相互独立。这一推广使得定理从纯粹的概率陈述进入了统计推断的实用领域——非中心参数的存在对应着备择假设下检验统计量的分布,是功效函数计算的理论基础。

矩阵形式的几何直观

Cochran定理的矩阵语言蕴含着清晰的几何图景。将Rn\mathbb{R}^n空间按特征子空间进行正交分解:每个幂等矩阵Ai\mathbf{A}_i向其rir_i维子空间ViV_i正交投影,条件Ai=In\sum\mathbf{A}_i=\mathbf{I}_n等价于诸子空间V1,,VkV_1,\dots,V_k构成Rn\mathbb{R}^n正交直和分解——即空间中的任意向量可唯一表示为它在各ViV_i上投影的向量和。随机向量在正交子空间上的投影长度平方即为对应的二次型取值,而标准正态向量的球对称性保证了这些投影长度既相互独立又各自服从卡方分布。这一几何视角揭示了Cochran定理的本质:对于球对称的随机向量,正交子空间上的投影天然地继承了独立性和卡方性这两个优良的分布性质。

与Fisher引理的关系Fisher引理是Cochran定理在k=2k=2时的特例。取A1=1n11\mathbf{A}_1=\frac{1}{n}\mathbf{1}\mathbf{1}'(向全1向量的常向量子空间做投影)和A2=In1n11\mathbf{A}_2=\mathbf{I}_n-\frac{1}{n}\mathbf{1}\mathbf{1}'(向其正交补空间做投影),则二次型XA1X=nXˉ2\mathbf{X}'\mathbf{A}_1\mathbf{X}=n\bar{X}^2XA2X=(XiXˉ)2\mathbf{X}'\mathbf{A}_2\mathbf{X}=\sum(X_i-\bar{X})^2相互独立,且后者服从σ2χn12\sigma^2\chi^2_{n-1}。Cochran定理将Fisher引理中样本均值与样本方差独立的经典结论推广至任意有限正交分解,从而覆盖了多因素实验设计、回归分析中多个线性约束同时检验等更一般的统计场景。

在方差分析中的核心应用

Cochran定理是方差分析(ANOVA)平方和分解的严格数学依据。以单因素方差分析为例,总平方和SST=i,j(XijXˉ)2\text{SST}=\sum_{i,j}(X_{ij}-\bar{X}_{\cdot\cdot})^2被正交分解为组间平方和SSB\text{SSB}与组内平方和SSW\text{SSW}之和:

SST=SSB+SSW.\text{SST} = \text{SSB} + \text{SSW}.

从几何上看,将观测向量分别投影到组均值张成的子空间和组内残差子空间,所得的两个投影矩阵幂等、正交且秩和等于总样本量nn。Cochran定理直接保证:在零假设(各组均值相等)下,SSB/σ2χk12\text{SSB}/\sigma^2\sim\chi^2_{k-1}SSW/σ2χnk2\text{SSW}/\sigma^2\sim\chi^2_{n-k},二者相互独立。由此构造的F统计量F=SSB/(k1)SSW/(nk)F=\frac{\text{SSB}/(k-1)}{\text{SSW}/(n-k)}恰好服从中心F分布Fk1,nkF_{k-1,n-k}——这就是F检验的全部概率基础。若缺失Cochran定理的独立性保证,F统计量中分子与分母的比值分布将无从推导,ANOVA的推断逻辑链便会从根基处断裂。

在多因素方差分析、拉丁方设计、裂区设计等复杂实验结构中,总平方和的正交分解涉及三个或更多分量(如主效应、交互效应和误差),此时Fisher引理已不敷使用,必须借助Cochran定理的一般形式才能为各效应的F检验提供分布理论基础。

在线性回归与一般线性假设检验中的角色

线性回归模型Y=Xβ+ε, εN(0,σ2I)\mathbf{Y}=\mathbf{X}\boldsymbol{\beta}+\boldsymbol{\varepsilon},\ \boldsymbol{\varepsilon}\sim N(\mathbf{0},\sigma^2\mathbf{I})的框架下,Cochran定理支撑着三个层次的统计推断。其一,总平方和YY\mathbf{Y}'\mathbf{Y}分解为回归平方和与残差平方和,两个投影矩阵幂等且正交,定理保证残差平方和服从σ2χnp2\sigma^2\chi^2_{n-p},这是σ2\sigma^2的无偏估计和回归F检验的基础。其二,在嵌套模型的额外平方和检验中,约束模型与无约束模型的残差平方和之差构成一个独立的二次型分量,其卡方性同样由定理的再多一个分量的正交分解保证。其三,对于一般的线性假设H0:Cβ=0H_0:\mathbf{C}\boldsymbol{\beta}=\mathbf{0}Wald检验在正态线性模型下具有精确F分布,这一定性同样根植于Cochran定理及其非中心推广。

证明思路概述

Cochran定理的经典证明采用谱分解与矩母函数相结合的策略。首先利用对称矩阵的谱定理将各Ai\mathbf{A}_i对角化,在适当的正交变换下X\mathbf{X}化为独立标准正态变量Z1,,ZnZ_1,\dots,Z_n,各二次型化为若干Zj2Z_j^2的线性组合。幂等性条件Ai2=Ai\mathbf{A}_i^2=\mathbf{A}_i等价于对应矩阵的特征值仅为0或1,故每个二次型恰为rir_i个独立标准正态变量的平方和,立即得到卡方性。独立性则由诸Ai\mathbf{A}_i两两正交(即AiAj=0, ij\mathbf{A}_i\mathbf{A}_j=\mathbf{0},\ i\neq j)保证,这一正交性可从Ai=In\sum\mathbf{A}_i=\mathbf{I}_n结合幂等性导出。秩和条件ri=n\sum r_i=n则确保了分解是完备无遗漏的。上述三个步骤环环相扣,构成了统计推断课程中最为精炼优美的证明链条之一。

历史背景与当代意义

William Gemmell Cochran(1909--1980)是二十世纪最具影响力的统计学家之一,其对抽样调查、实验设计和分类数据分析均有奠基性贡献。1934年,年仅二十五岁的Cochran在爱丁堡大学攻读博士期间,于Proceedings of the Cambridge Philosophical Society发表了这一定理,原始动机来自农业田间试验中的方差分析问题——如何从数学上严格确立平方和的正交分解与独立卡方分布之间的等价关系。

Cochran定理发表于FisherStatistical Methods for Research Workers(1925)问世后不足十年,它及时地为Fisher所倡导的方差分析方法论补全了缺失的严格概率框架,使ANOVA从实用统计技术提升为具有严密理论支撑的推断体系。在当代统计学教学与研究中,Cochran定理是线性模型理论、多元统计分析随机效应模型和混合效应模型推导中不可或缺的核心工具。从一门研究生课程中的标准定理到日常数据分析中每一次F检验的隐性前提,Cochran定理的影响深远而弥散。