ARTICLE

对部分系数的联合显著性检验

对部分系数的联合显著性检验 (Joint Significance Test for a Subset of Coefficients) 对部分系数的联合显著性检验,通常简称为 F检验 (F-test),是\%计量经济学\%和\%统计学\%中\%多元线性回归模型\% (Multiple Linear Regression Model) 的一个核心假设检验方法

浏览 0

对部分系数的联合显著性检验 (Joint Significance Test for a Subset of Coefficients)

对部分系数的联合显著性检验,通常简称为 F检验 (F-test),是\%计量经济学\%和\%统计学\%中\%多元线性回归模型\% (Multiple Linear Regression Model) 的一个核心假设检验方法。它的目的是判断一组(两个或更多)\%自变量\%(explanatory variables)作为一个整体,是否对\%因变量\%(dependent variable)具有统计上显著的影响。

与检验单个系数是否显著的\%t检验\%不同,联合显著性检验评估的是多个系数同时为零的\%零假设\%。这在检验复杂的经济理论、比较不同模型设定或处理\%多重共线性\%问题时至关重要。

检验的动机与目的

在构建一个\%回归模型\%时,我们常常需要回答一个问题:某一组变量是否应该被包含在模型中?

例如,在一个预测工资水平的模型中,我们可能不仅关心教育年限和工作经验,还关心一系列代表个人家庭背景的变量(如父母收入、父母教育水平等)。我们可能想知道,在控制了教育和经验之后,这些家庭背景变量作为一个整体,是否还能解释工资的变化。

单独对每个背景变量进行\%t检验\%可能会产生误导。原因有二:

  1. \%第一类错误\%的膨胀 (Inflation of Type I Error):如果我们对多个系数分别进行多次t检验,每次检验都有一定概率犯下第一类错误(即错误地拒绝了本为真的零假设)。进行越多的检验,至少犯一次第一类错误的累积概率就越大。联合检验通过一次测试解决了这个问题。
  2. \%多重共线性\% (Multicollinearity):如果一组自变量之间高度相关,那么单个系数的估计可能不精确,导致它们的\%标准误\%偏大,t统计量偏小。这可能使我们错误地得出每个变量都不显著的结论(即无法拒绝单个的H0:βi=0 H_0: \beta_i = 0 )。然而,作为一个整体,这组变量可能对因变量有很强的解释力。联合检验能够有效地发现这种整体性的显著影响。

因此,联合显著性检验提供了一种更严谨、更可靠的方法来评估一组变量的集体解释能力。

检验的逻辑:受约束模型 vs. 无约束模型

联合显著性检验的核心思想是比较两个模型:一个无约束模型 (Unrestricted Model) 和一个受约束模型 (Restricted Model)

  • 无约束模型:这是包含所有待研究变量的完整模型。它的形式如下:
Y=β0+β1X1++βkqXkq+βkq+1Xkq+1++βkXk+uY = \beta_0 + \beta_1 X_1 + \dots + \beta_{k-q} X_{k-q} + \beta_{k-q+1} X_{k-q+1} + \dots + \beta_k X_k + u

其中,我们要检验的是最后 q q 个变量的联合显著性。这个模型不对任何系数施加约束,因此我们从中得到的残差平方和记为 SSRUR SSR_{UR} (Sum of Squared Residuals from Unrestricted model)。

  • 受约束模型:这是在零假设为真的前提下构建的模型。零假设是,我们感兴趣的那组变量的系数同时为零。因此,我们将这些变量从模型中移除,从而对模型施加了“约束”。其形式如下:
Y=β0+β1X1++βkqXkq+uY = \beta_0 + \beta_1 X_1 + \dots + \beta_{k-q} X_{k-q} + u

我们从这个简化的模型中得到的残差平方和记为 SSRR SSR_R (Sum of Squared Residuals from Restricted model)。

基本逻辑: 如果这 q q 个变量是联合显著的,那么将它们从模型中移除(即从无约束模型变为受约束模型)会导致模型的拟合优度显著下降。模型的拟合优度下降,体现在\%残差平方和\% (Sum of Squared Residuals, SSR) 的显著增加上。因此,SSRR SSR_R 将会比 SSRUR SSR_{UR} 大得多。

反之,如果这 q q 个变量是联合不显著的,那么将它们移除对模型的拟合优度影响不大,SSRR SSR_R 将会与 SSRUR SSR_{UR} 非常接近。

F检验正是将这种 SSR SSR 的变化量化,并根据其大小做出统计推断。

假设检验的构建

假设在一个包含 k k 个自变量的多元回归模型中,我们希望检验最后 q q 个变量的联合显著性。

  1. 建立假设
  • \%零假设\% (H0 H_0 ): 这一组变量的系数全部为零。
H0:βkq+1=0,,βk=0H_0: \beta_{k-q+1} = 0, \dots, \beta_k = 0
  • \%备择假设\% (Ha H_a ): 上述系数中至少有一个不为零。
Ha:H0 is not true.H_a: H_0 \text{ is not true.}
  1. 构造F统计量

F统计量的计算公式如下:

F=(SSRRSSRUR)/qSSRUR/(nk1)F = \frac{(SSR_R - SSR_{UR}) / q}{SSR_{UR} / (n - k - 1)}

我们来分解这个公式的各个部分:

  • SSRR SSR_R : 受约束模型的残差平方和。
  • SSRUR SSR_{UR} : 无约束模型的残差平方和。
  • q q : 约束的个数,即零假设中被设定为零的系数的个数。这也是F分布的分子\%自由度\%
  • n n : 样本中的观测点数量。
  • k k : 无约束模型中自变量的总数。
  • nk1 n - k - 1 : 无约束模型的自由度。这也是F分布的分母\%自由度\%

直观解释

  • 分子 (SSRRSSRUR)/q (SSR_R - SSR_{UR}) / q 表示由于施加了 q q 个约束,每个约束平均导致残差平方和增加了多少。
  • 分母 SSRUR/(nk1) SSR_{UR} / (n - k - 1) 是无约束模型的\%均方误\% (Mean Squared Error),即对模型误差项方差 σ2 \sigma^2 的一个无偏估计。它代表了模型中无法被解释的平均变异程度。
  • 整个F统计量衡量的就是:由于移除了 q q 个变量所导致的模型拟合度相对下降的幅度,是否大到足以认为是统计显著的。
  1. 决策规则

在零假设成立的条件下,该F统计量服从一个具有 (q,nk1) (q, n-k-1) 自由度的 \%F分布\% (F-distribution)

  • 临界值法:在给定的\%显著性水平\% α \alpha (例如 0.05) 下,我们可以在F分布表中查找到对应的临界值 Fα,q,nk1 F_{\alpha, q, n-k-1} 。如果计算出的 F 统计量大于该临界值 (Fcalculated>Fcritical F_{calculated} > F_{critical} ),我们就拒绝零假设 H0 H_0 ,认为这组变量是联合显著的。
  • \%p值\%法:现代统计软件会直接计算出与该F统计量相对应的p值。p值表示在零假设为真的情况下,观测到当前F值或更极端值的概率。如果p值小于显著性水平 α \alpha (p<α p < \alpha ),我们就拒绝零假设 H0 H_0

重要特例

1. 模型的整体显著性检验 (Overall Significance Test)

这是联合显著性检验最常见的一个特例。它检验的是模型中所有自变量的系数是否联合为零。

  • H0:β1=β2==βk=0 H_0: \beta_1 = \beta_2 = \dots = \beta_k = 0
  • Ha: H_a: 至少有一个 βj0 \beta_j \neq 0 (for j=1,,k j=1, \dots, k )

在这种情况下,q=k q = k 。受约束模型就变成了一个只包含截距项的模型:Y=β0+u Y = \beta_0 + u 。这个检验的结果通常是任何回归分析软件输出的标准部分,用于判断整个回归方程是否有意义。如果这个检验都无法通过(即不能拒绝H0 H_0 ),则说明我们建立的整个模型没有解释力。

2. 与t检验的关系

当联合检验只涉及一个系数时(即 q=1 q=1 ),F检验的结果与对该系数进行的双侧t检验是等价的。

  • H0:βj=0 H_0: \beta_j = 0
  • Ha:βj0 H_a: \beta_j \neq 0

在这种特殊情况下,可以证明所计算出的F统计量恰好是t统计量的平方:

F=tβj2F = t^2_{\beta_j}

两个检验的p值也会完全相同。这提供了一个在单一系数和多个系数检验之间建立联系的桥梁。

verified: true