ARTICLE
F检验
F检验 (F-test) F检验(F-test)是一种以方差比较为核心的假设检验方法,由英国统计学家罗纳德·爱尔默·费歇尔(Ronald Aylmer Fisher)创立并命名。F检验的核心统计量遵循F分布,其本质是两个方差估计量之比,被广泛用于方差分析 (ANOVA)、回归分析以及线性约束检验中,是评估统计模型整体有效性的基础工具。 核心原理:方差分解 F
F检验 (F-test)
F检验(F-test)是一种以方差比较为核心的假设检验方法,由英国统计学家罗纳德·爱尔默·费歇尔(Ronald Aylmer Fisher)创立并命名。F检验的核心统计量遵循F分布,其本质是两个方差估计量之比,被广泛用于方差分析 (ANOVA)、回归分析以及线性约束检验中,是评估统计模型整体有效性的基础工具。
核心原理:方差分解
F检验的逻辑建立在方差分解之上。因变量的总变异(总平方和,SST)可分解为两部分:
其中,SSR(回归平方和,亦称模型平方和 SSM 或组间平方和 SSB)是模型能够解释的变异;SSE(残差平方和,亦称组内平方和 SSW)是模型无法解释的随机变异。若模型有效,SSR 应显著大于 SSE。
F统计量的构建
F统计量定义为两个均方(Mean Square, MS)之比——将平方和除以对应的自由度(df)得到方差估计值:
其中 为分子自由度(模型中参数个数或组数减一), 为分母自由度(样本量减去模型所用参数)。直观理解:分子度量模型解释的平均变异(信号),分母度量随机误差的平均变异(噪声)。F值远大于1意味着信号显著超过噪声,支持模型有效。
假设检验框架
F检验遵循标准假设检验程序:
- 建立假设:零假设 断言模型无效(回归系数全为零,或各组均值相等);备择假设 断言模型有效(至少一个系数非零,或至少一组均值不同)。
- 计算F统计量:由样本数据带入公式。
- 决策规则:在显著性水平 (如0.05)下,若 或计算出的p值 ,拒绝 。F分布是由 共同决定的右偏分布。
- 结论:拒绝 表明统计上存在显著证据支持模型有效,但无法指明具体哪个变量或哪组之间显著。
主要应用场景
回归整体显著性检验:在多元线性回归 中,,自由度 ,。显著F值表明所有自变量联合解释力显著,但单个系数显著性需通过t检验逐一判定。
方差分析 (ANOVA):比较 组均值,,,自由度 ,。显著结果需通过事后检验(如Tukey's HSD或Bonferroni校正)进行两两比较。
线性约束检验:比较无约束模型与约束模型:
其中 为约束数量, 为无约束模型自变量数。此法在邹检验中用于检验结构性变化。
方差齐性检验:检验两总体方差相等 ,(较大方差置于分子)。这是两样本t检验的前提步骤。
假设条件与稳健性
F检验的有效性依赖三个关键假设:独立性(观测值互不相关)、正态性(各组的因变量或残差服从正态分布)、方差齐性(各组总体方差相等,或误差方差在自变量各水平上恒定)。F检验对方差齐性违反较敏感;在样本量足够大时,由于中心极限定理,对轻度正态性偏离具有一定稳健性。当假设不满足时,可考虑Welch校正或非参数替代方法。