ARTICLE

F-statistic

F统计量 (F-statistic) F统计量是统计学和计量经济学中用于检验多个线性约束条件是否同时成立的核心工具。它以统计学家罗纳德·费雪 (Ronald Fisher) 命名,广泛出现在回归分析、方差分析 (ANOVA) 和模型选择中。F统计量的本质是比较两个嵌套模型——受约束模型与无约束模型——在解释数据能力上的相对差异,从而判断约束条件是否可以被数据

浏览 4 更新 2026-05-25

F统计量 (F-statistic)

F统计量统计学计量经济学中用于检验多个线性约束条件是否同时成立的核心工具。它以统计学家罗纳德·费雪 (Ronald Fisher) 命名,广泛出现在回归分析方差分析 (ANOVA) 和模型选择中。F统计量的本质是比较两个嵌套模型——受约束模型与无约束模型——在解释数据能力上的相对差异,从而判断约束条件是否可以被数据所接受。

定义与分布

F统计量构造为两个独立的卡方分布随机变量各自除以其自由度之后的比值。正式地,若 U1χ2(d1)U_1 \sim \chi^2(d_1)U2χ2(d2)U_2 \sim \chi^2(d_2),且二者独立,则:

F=U1/d1U2/d2F(d1,d2)F = \frac{U_1 / d_1}{U_2 / d_2} \sim F(d_1, d_2)

该随机变量服从自由度为 (d1,d2)(d_1, d_2)F分布。F分布定义在非负实数域上,其形状依赖于分子和分母的自由度:当分母自由度较大时,分布趋近于放缩后的卡方分布;当分子自由度为1时,F统计量等于对应t统计量的平方。

回归分析中的F检验

在线性回归模型 Y=Xβ+εY = X\beta + \varepsilon(其中 εN(0,σ2In)\varepsilon \sim N(0, \sigma^2 I_n))中,F统计量最常见的应用是检验一组线性约束是否同时成立。

总体显著性检验

对于回归模型 Y=β0+β1X1++βkXk+uY = \beta_0 + \beta_1 X_1 + \cdots + \beta_k X_k + u,我们希望检验所有斜率系数是否同时为零:

H0:β1=β2==βk=0H_0: \beta_1 = \beta_2 = \cdots = \beta_k = 0

相应的F统计量为:

F=R2/k(1R2)/(nk1)=ESS/kRSS/(nk1)F = \frac{R^2 / k}{(1 - R^2) / (n - k - 1)} = \frac{ESS / k}{RSS / (n - k - 1)}

其中 R2R^2 为判定系数,ESSESS 为回归平方和(Explained Sum of Squares),RSSRSS 为残差平方和(Residual Sum of Squares),nn 为样本量,kk 为解释变量个数。该统计量在 H0H_0 下服从 F(k,nk1)F(k, n-k-1) 分布。

一般线性约束的检验

更一般地,考虑 qq 个线性约束 H0:Rβ=rH_0: R\beta = r,其中 RRq×(k+1)q \times (k+1) 约束矩阵。F统计量可以等价地表示为两种形式:

基于残差平方和的形式

F=(SSRrSSRur)/qSSRur/(nk1)F = \frac{(SSR_r - SSR_{ur}) / q}{SSR_{ur} / (n - k - 1)}

其中 SSRrSSR_r 为受约束回归的残差平方和(施加 H0H_0 后估计),SSRurSSR_{ur} 为无约束回归的残差平方和。直观上,若约束条件近似成立,两个残差平方和应接近,F统计量较小;若约束严重偏离真实情况,SSRrSSR_r 将显著大于 SSRurSSR_{ur},F统计量增大,倾向于拒绝原假设。

基于估计量的二次型

F=(Rβ^r)T[R(XTX)1RT]1(Rβ^r)/qσ^2F = \frac{(R\hat{\beta} - r)^T [R(X^TX)^{-1}R^T]^{-1} (R\hat{\beta} - r) / q}{\hat{\sigma}^2}

其中 β^\hat{\beta} 为无约束OLS估计量,σ^2=SSRur/(nk1)\hat{\sigma}^2 = SSR_{ur}/(n-k-1)无偏估计的误差方差。这两种表达在数学上完全等价,但适用场景有所不同:残差平方和形式更适合手工计算,二次型形式则更便于理论推导和编程实现。

与t检验的关系

当约束条件仅为单个约束(q=1q = 1)时,F统计量与t统计量存在精确的对应关系:

F(1,nk1)=[t(nk1)]2F(1, n-k-1) = [t(n-k-1)]^2

即自由度为 vv 的t变量的平方服从 F(1,v)F(1, v) 分布。因此,对于单个系数的显著性检验,t检验与F检验给出完全一致的p值。然而,当需要同时检验多个假设时(如检验 β1=0\beta_1 = 0β2=0\beta_2 = 0),只能使用F检验——逐一进行t检验会放大第一类错误,而F检验通过联合检验保持了检验的显著性水平。

方差分析 (ANOVA) 中的F统计量

方差分析框架中,F统计量用于比较组间变异与组内变异的相对大小。对于有 GG 个组的单因素ANOVA:

F=SSB/(G1)SSW/(nG)F = \frac{SSB / (G - 1)}{SSW / (n - G)}

其中 SSBSSB 为组间平方和(Between-group Sum of Squares),衡量各组均值之间的变异;SSWSSW 为组内平方和(Within-group Sum of Squares),衡量组内个体间的随机变异。若F统计量显著大于1,说明组间变异超出了随机波动所能解释的范围,从而拒绝"各组均值相等"的原假设。ANOVA模型本质上是回归模型中所有解释变量均为虚拟变量的特例,因此ANOVA的F检验与回归的F检验在数学结构上完全统一。

检验的假设与注意事项

F检验的有效性依赖于以下关键假设:

  1. 正态性:误差项 ε\varepsilon 服从正态分布。在大样本下,由于中心极限定理,F统计量对正态性偏离具有一定稳健性,但在小样本中正态性至关重要。
  2. 同方差性:误差项方差恒定(Var(εi)=σ2\mathrm{Var}(\varepsilon_i) = \sigma^2)。若存在异方差性,标准F检验不再有效,需使用异方差稳健标准误并构造Wald统计量(在大样本下近似服从卡方分布)。
  3. 独立性:观测值之间相互独立。若存在自相关或聚类结构,需使用聚类稳健标准误,或转而使用基于块自助法 (block bootstrap) 的检验。
  4. 模型设定正确:受约束模型与无约束模型均为真实数据生成过程的正确设定(或至少无约束模型的设定正确)。若存在遗漏变量偏误或错误的函数形式,F检验的结果可能产生误导。

Chow检验:结构稳定性检验

F统计量的一个重要应用是邹至庄检验 (Chow Test),用于判断两个不同时期或两个不同群体之间的回归系数是否存在结构性变化。其核心思想是将全样本回归作为无约束模型,将两个子样本分别回归(允许系数不同)视为无约束模型的等价变体,构造F统计量:

F=[SSRp(SSR1+SSR2)]/k(SSR1+SSR2)/(n1+n22k)F = \frac{[SSR_p - (SSR_1 + SSR_2)] / k}{(SSR_1 + SSR_2) / (n_1 + n_2 - 2k)}

其中 SSRpSSR_p 为合并样本的残差平方和,SSR1SSR_1SSR2SSR_2 分别为两组子样本的残差平方和。若F统计量显著,表明两组的回归系数存在结构性差异。

总结

F统计量是统计推断中检验多个约束条件的标准方法,它将复杂的联合假设转化为一个标量检验统计量,并通过F分布提供精确的p值。在计量经济学实践中,F统计量不仅是回归输出中的核心指标(如Stata输出中的 \texttt{F( k, n-k-1)} 和 \texttt{Prob > F}),更是理解模型比较、假设检验和方差分解等统计思想的入口。掌握F统计量的构造原理和适用条件,是进行严谨实证研究的基本功。对于不满足经典假设的情形,研究者应转而使用Wald检验、似然比检验拉格朗日乘子检验等替代方法,并谨慎解释结果。