ARTICLE

F-分布

F-分布 (F-distribution) F-分布 (F-distribution)，全称为费雪-斯内德克分布 (Fisher-Snedecor distribution)，是概率论和统计学中一种至关重要的连续概率分布。它以统计学家罗纳德·艾尔默·费雪 (Ronald Fisher) 和乔治·斯内德克 (George Snedecor) 的名字

浏览 56 更新 2025-10-26

F-分布 (F-distribution)

F-分布 (F-distribution)，全称为 费雪-斯内德克分布 (Fisher-Snedecor distribution)，是概率论和统计学中一种至关重要的连续概率分布。它以统计学家罗纳德·艾尔默·费雪 (Ronald Fisher) 和乔治·斯内德克 (George Snedecor) 的名字命名。F-分布的核心应用在于 F检验 (F-test)，广泛用于比较多个总体的均值（如在方差分析中）和评估线性回归模型的显著性。F-分布由两个参数定义：分子自由度 $d_1$ 和分母自由度 $d_2$ 。

定义与构造

F-分布的理论基础源于卡方分布 (Chi-squared distribution)。假设有两个独立的随机变量 $U$ 和 $V$ ：

$U$ 服从自由度为 $d_1$ 的卡方分布，记作 $U \sim \chi^2(d_1)$ 。
$V$ 服从自由度为 $d_2$ 的卡方分布，记作 $V \sim \chi^2(d_2)$ 。

将这两个随机变量分别除以其各自的自由度，然后求其比值，所得到的新的随机变量 $F$ 就服从分子自由度为 $d_1$ 、分母自由度为 $d_2$ 的 F-分布：

F = \frac{U/d_1}{V/d_2} \sim F(d_1, d_2)

从这个构造中可直接得出两个重要结论：F-分布取值非负 ( $F \ge 0$ )，且自由度顺序至关重要—— $F(d_1, d_2)$ 和 $F(d_2, d_1)$ 是两种不同的分布。一个重要性质是：若 $X \sim F(d_1, d_2)$ ，则 $1/X \sim F(d_2, d_1)$ 。

主要性质

概率密度函数

F-分布的概率密度函数形式较为复杂，但揭示了其形状完全由 $d_1$ 和 $d_2$ 决定：

f(x; d_1, d_2) = \frac{\sqrt{\frac{(d_1 x)^{d_1} d_2^{d_2}}{(d_1 x + d_2)^{d_1+d_2}}}}{x B\!\left(\frac{d_1}{2}, \frac{d_2}{2}\right)}, \quad x \ge 0

其中 $B$ 是 Beta函数。实际应用中通常通过统计软件或 F-分布表获得概率或临界值，不直接使用此公式。

分布形状

F-分布是 右偏态 (positively skewed) 的，其峰值接近 1。随着 $d_1$ 和 $d_2$ 的增大，偏度减小，分布逐渐对称。当 $d_1$ 和 $d_2$ 趋向无穷大时，F-分布趋近于正态分布。

均值与方差

均值： $E[F] = \dfrac{d_2}{d_2-2}$ ，其中 $d_2 > 2$ 。仅与分母自由度有关，且总是略大于 1。当 $d_2 \le 2$ 时均值不存在。
方差： $\operatorname{Var}(F) = \dfrac{2d_2^2(d_1+d_2-2)}{d_1(d_2-2)^2(d_2-4)}$ ，其中 $d_2 > 4$ 。当 $d_2 \le 4$ 时方差不存在。

与其他分布的关系

若 $T \sim t(d)$ ，则 $T^2 \sim F(1, d)$ 。这解释了在单变量回归中对单个系数的 t 检验与整体 F 检验的等价性。
当分母自由度 $d_2 \to \infty$ 时， $d_1 F \to \chi^2(d_1)$ 。

在统计推断中的应用

方差分析 (ANOVA)

这是 F-分布最经典的应用。ANOVA 检验三个或更多总体均值是否相等。检验统计量为组间均方 (MSG) 与组内均方 (MSE) 的比值：

F = \frac{MSG}{MSE} = \frac{SSB/(k-1)}{SSW/(N-k)}

其中 $k$ 为组数， $N$ 为总样本量。在原假设（所有均值相等）下，该统计量服从 $F(k-1, N-k)$ 分布。若 F 值远大于 1，说明组间变异显著大于组内变异，提供拒绝原假设的证据。

线性回归模型的整体显著性检验

在多元线性回归中，F 检验判断模型整体是否显著。原假设为所有自变量系数均为零 ( $\beta_1 = \beta_2 = \ldots = \beta_p = 0$ )。F 统计量为：

F = \frac{MSR}{MSE} = \frac{SSR/p}{SSE/(n-p-1)}

其中 $p$ 为自变量个数， $n$ 为样本量。在零假设下服从 $F(p, n-p-1)$ 分布。大的 F 值表明模型具有整体显著性。

两个总体方差的齐性检验

F 检验可直接比较两个独立正态总体的方差是否相等。检验统计量为两个样本方差的比值：

F = \frac{s_1^2}{s_2^2}

在原假设 ( $\sigma_1^2 = \sigma_2^2$ ) 下服从 $F(n_1-1, n_2-1)$ 分布。为便于查表，通常将较大样本方差置于分子。

解读与决策

进行 F 检验时，将计算出的 F 统计量与临界值比较，或考察 p值：

给定显著性水平 $\alpha$ ，若 $F_{\text{calculated}} > F_{\alpha, d_1, d_2}$ ，则拒绝原假设。
若 p 值小于 $\alpha$ ( $p < \alpha$ )，则拒绝原假设。现代统计软件（R、Python、SPSS 等）自动输出 F 统计量及其 p 值。

F-分布是连接样本方差与总体方差的核心桥梁。其本质思想是：若两个方差估计量（如 ANOVA 中的 MSG 和 MSE）均来源于同一总体方差，则比值应在 1 附近波动；若显著偏离 1，则表明其背后的方差来源或均值存在差异。这一原理使其成为比较方差和均值的强大工具，在经济学、金融学、生物学、工程学等领域有广泛应用。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。