ARTICLE

方差差异F检验

方差差异F检验 (F-test for Equality of Variances) 方差差异F检验 (F-test for Equality of Variances)，也称为方差比率检验 (Variance Ratio Test)，是一种统计假设检验方法，用于判断两个独立、且服从Normal Distribution 正态分布的总体，其方差是否相等。这

浏览 19 更新 2025-10-25

方差差异F检验 (F-test for Equality of Variances)

方差差异F检验 (F-test for Equality of Variances)，也称为 方差比率检验 (Variance Ratio Test)，是一种统计假设检验方法，用于判断两个独立、且服从Normal Distribution|正态分布的总体，其方差是否相等。这是许多参数检验（如两独立样本t-test）前需要满足或验证的一个重要假设。

此检验的核心思想是比较两个样本的方差。如果两个总体的方差确实相等，那么从这两个总体中抽取的样本方差之比，应该会接近1。如果这个比率显著地偏离1，我们就有理由怀疑两个总体的方差不相等。这个比率所服从的统计分布就是F-distribution。

检验的原理与假设构建

方差差异F检验是建立在假设检验的框架之上的。检验的基本步骤涉及设立null hypothesis和alternative hypothesis。

零假设 ( $H_0$ )：两个总体的方差相等。

H_0: \sigma_1^2 = \sigma_2^2

其中 $\sigma_1^2$ 和 $\sigma_2^2$ 分别代表第一个和第二个总体的方差。

备择假设 ( $H_a$ 或 $H_1$ )：备择假设可以有三种形式，取决于研究者想要检验的方向。

双尾检验 (Two-tailed test)：两个总体的方差不相等。这是最常见的形式。

H_a: \sigma_1^2 \neq \sigma_2^2

右尾检验 (Right-tailed test)：第一个总体的方差大于第二个总体的方差。

H_a: \sigma_1^2 > \sigma_2^2

左尾检验 (Left-tailed test)：第一个总体的方差小于第二个总体的方差。

H_a: \sigma_1^2 < \sigma_2^2

F统计量的计算

检验所使用的test statistic|检验统计量是F统计量，其计算公式为两个样本方差的比值：

F = \frac{S_1^2}{S_2^2}

其中：

$S_1^2$ 是第一个样本的sample variance|样本方差。
$S_2^2$ 是第二个样本的sample variance|样本方差。

为了简化查阅F分布表和决策过程，通常遵循一个约定：将数值较大的样本方差置于分子，较小的样本方差置于分母。这样可以确保计算出的F值总是大于或等于1，从而我们只需要关注F分布的右尾。

采用此约定后，公式变为：

F = \frac{S_{\text{larger}}^2}{S_{\text{smaller}}^2}

其中 $S_{\text{larger}}^2$ 是两个样本方差中较大的那个，而 $S_{\text{smaller}}^2$ 是较小的那个。

这个F统计量服从一个具有两个参数的F分布：

分子自由度 ( $df_1$ )：与分子中的样本方差相对应的自由度， $df_1 = n_1 - 1$ ，其中 $n_1$ 是分子样本的样本量。
分母自由度 ( $df_2$ )：与分母中的样本方差相对应的自由度， $df_2 = n_2 - 1$ ，其中 $n_2$ 是分母样本的样本量。

需要注意的是，自由度的归属取决于哪个样本的方差被放在了分子上。

决策过程

进行F检验的决策过程通常包括以下几个步骤：

设定显著性水平 ( $\alpha$ )：首先确定一个significance level|显著性水平 $\alpha$ ，它代表了犯Type I error|第一类错误（即当零假设为真时错误地拒绝它）的概率。通常选定为 0.05 或 0.01。

计算F统计量：根据样本数据计算出两个样本的方差 $S_1^2$ 和 $S_2^2$ ，并按照 $F = S_{\text{larger}}^2 / S_{\text{smaller}}^2$ 的约定计算F值。同时确定对应的分子自由度 $df_1$ 和分母自由度 $df_2$ 。

确定决策规则：有两种主流的方法来做出决策。

临界值法 (Critical Value Approach)

我们从F分布表中查找在指定显著性水平和自由度下的critical value|临界值。

对于一个双尾检验，由于我们已经将较大的方差置于分子，我们实际上是将检验集中在了右尾。因此，我们需要将显著性水平 $\alpha$ 减半，即查找临界值 $F_{\alpha/2, df_1, df_2}$ 。
决策规则：如果计算出的F统计量 $F_{calculated} > F_{\alpha/2, df_1, df_2}$ ，则检验结果落在rejection region|拒绝域内，我们应该reject the null hypothesis|拒绝零假设。否则，我们fail to reject the null hypothesis|不拒绝零假设。

p值法 (p-value Approach)

p-value是在零假设为真的前提下，观测到当前或更极端检验统计量的概率。对于F检验（采用大方差在分子的约定），p值计算为 $P(F_{df_1, df_2} \ge F_{calculated})$ 。然后，将这个单尾概率乘以2，以获得双尾检验的p值。

决策规则：如果 $p\text{-value} < \alpha$ ，我们应该拒绝零假设。否则，不拒绝零假设。

得出结论：根据决策规则，对总体的方差是否相等给出统计结论。

如果拒绝 $H_0$ ，则有充分的统计证据表明两个总体的方差不相等。
如果不拒绝 $H_0$ ，则没有足够的证据表明两个总体的方差不同，我们通常会认为它们是相等的（即满足homoscedasticity|方差齐性）。

重要假设与局限性

方差差异F检验有一个非常重要的前提假设，它的可靠性严重依赖于此。

正态性假设：F检验假定两个样本都来自服从Normal Distribution|正态分布的总体。这个检验对偏离正态性的情况非常敏感。如果数据不服从正态分布（例如，存在严重的偏斜或厚尾），F检验的结果可能会变得非常不可靠，其Type I error|第一类错误率可能会远高于设定的显著性水平 $\alpha$ 。

由于F检验对非正态性的敏感性（即其稳健性较差），在实际应用中，许多统计学家和研究者更倾向于使用对正态性假设不那么敏感的替代方法，例如：

Levene's test：Levene检验通过对原始数据进行转换（例如，计算每个观测值与其组均值的偏差绝对值），然后对转换后的数据进行ANOVA。它比F检验对非正态性更具robustness|稳健性。
Bartlett's test：Bartlett检验也是一种用于检验方差齐性的方法。它同样对数据的正态性非常敏感，但在数据确认服从正态分布时，它的统计功效比Levene检验更高。
Brown–Forsythe test：这是Levene检验的一个修正版本，它使用与组中位数的偏差绝对值，而不是与组均值的偏差，这使其对异常值更加稳健。

应用场景

F检验最经典的应用是在进行两独立样本t检验之前，作为一项预备检验。

如果F检验的结果表明方差相等（不拒绝 $H_0$ ），则应使用合并方差t检验 (Pooled Variance t-test)。
如果F检验的结果表明方差不相等（拒绝 $H_0$ ），则应使用不假设方差相等的Welch's t-test。

此外，方差齐性（Homoscedasticity）也是Analysis of Variance (ANOVA)|方差分析 (ANOVA)的一个基本假设。虽然单因素ANOVA对轻微的方差不齐具有一定的稳健性（特别是当各组样本量相等时），但在进行分析前检查此假设仍然是一个标准程序。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。