ARTICLE
方差分析的所有知识点
方差分析 (Analysis of Variance, ANOVA) 方差分析(Analysis of Variance,ANOVA)是一种重要的统计模型和假设检验方法,由统计学家罗纳德·费雪提出。其核心目标是比较两个或更多组的均值是否存在显著差异。尽管名称中包含"方差",ANOVA的最终目的并非检验方差差异,而是检验均值差异,通过分析不同组别之间数据的变异
方差分析 (Analysis of Variance, ANOVA)
方差分析(Analysis of Variance,ANOVA)是一种重要的统计模型和假设检验方法,由统计学家罗纳德·费雪提出。其核心目标是比较两个或更多组的均值是否存在显著差异。尽管名称中包含"方差",ANOVA的最终目的并非检验方差差异,而是检验均值差异,通过分析不同组别之间数据的变异来源来实现。ANOVA在实验设计、心理学、生物学、经济学和工程学等众多领域得到了广泛应用。
核心思想:方差分解
ANOVA的基本逻辑是将数据的总变异分解为不同来源的变异。总离差平方和(SST = )度量所有观测值与其总均值的总体差异,可以分解为两个独立的部分。
组间平方和(SSB或SSA,等于 )度量各组均值与总均值的差异,反映了处理效应或组间的系统性差异。组内平方和(SSW或SSE,等于 )度量各组内观测值与其组均值的差异,反映了随机误差或个体变异。恒等式SST = SSB + SSW成立,即总变异恰好等于组间变异与组内变异之和。
检验统计量与前提假设
F检验统计量的构造为 ,其中 为组数, 为总样本量,MSB和MSW分别为组间均方和组内均方(均方误差)。在原假设 成立时,F统计量服从自由度为 和 的 F分布。若组间差异相对于组内随机变异足够大,即F值较大,则拒绝原假设,认为至少有一组均值显著不同于其他组。
ANOVA依赖三个核心假设。第一,各总体服从正态分布(正态性),可用QQ图或Shapiro-Wilk检验检查。第二,各组方差相等(方差齐性),Levene检验是最常用的检验方法。第三,各观测之间相互独立,实验设计应保证随机分配或随机抽样。当正态性假设被中度违反时,F检验对偏离具有较好的稳健性;严重偏态时可考虑Kruskal-Wallis检验作为F检验的非参数检验替代。当方差齐性被违反时,可使用Welch ANOVA或Brown-Forsythe检验等稳健版本。
ANOVA的类型与延伸
主要的ANOVA类型包括:单因素ANOVA,仅包含一个因素及其多个水平,检验该因素对因变量的主效应;双因素ANOVA,包含两个因素,检验各因素的主效应以及它们之间的交互效应,模型形式为 ;重复测量ANOVA,对同一受试者在多个时间点或条件下的重复测量进行分析,能够控制个体差异从而提高统计功效;以及协方差分析(ANCOVA),在ANOVA中纳入一个或多个连续协变量以控制额外变异来源,提高估计精确度。
ANOVA中获得显著的F检验结果后,通常需要进行事后检验来确定具体哪些组之间存在差异。常用方法包括Tukey HSD(控制族系第I类错误率)、Bonferroni校正和Scheffé检验等。在计量经济学中,ANOVA与回归分析在形式上是等价的,当所有自变量均为分类变量时,ANOVA即为线性回归的特例。ANOVA作为比较组均值差异的基本统计方法,是假设检验体系中t检验向多元情形的自然推广,在实验科学中占有不可替代的基础地位。