ARTICLE

高斯-马尔可夫假定

高斯-马尔可夫假定 高斯-马尔可夫假定(Gauss-Markov Assumptions)是一组在线性回归模型框架下,用于证明普通最小二乘法(OLS)估计量为最佳线性无偏估计量(BLUE)的核心假定。这些假定构成经典线性回归模型的理论基石,其结论由高斯-马尔可夫定理阐述。 考虑多元线性回归模型: 其中 Y_i 为因变量,X_1i, , X_ki 为自变量,

浏览 40 更新 2025-10-25

高斯-马尔可夫假定

高斯-马尔可夫假定(Gauss-Markov Assumptions)是一组在线性回归模型框架下,用于证明普通最小二乘法(OLS)估计量为最佳线性无偏估计量(BLUE)的核心假定。这些假定构成经典线性回归模型的理论基石,其结论由高斯-马尔可夫定理阐述。

考虑多元线性回归模型:

Yi=β0+β1X1i+β2X2i++βkXki+uiY_i = \beta_0 + \beta_1 X_{1i} + \beta_2 X_{2i} + \dots + \beta_k X_{ki} + u_i

其中 YiY_i 为因变量,X1i,,XkiX_{1i}, \dots, X_{ki} 为自变量,β0,,βk\beta_0, \dots, \beta_k 为待估参数,uiu_i误差项

五个核心假定

假定一:参数的线性性。模型必须是关于参数 β0,,βk\beta_0, \dots, \beta_k 的线性函数。自变量可非线性变换(如 X2X^2logX\log X),但参数不能以指数、乘积等非线性形式出现。

假定二:随机抽样。样本通过随机抽样获得,观测值独立同分布(i.i.d.)。此假定确保样本代表总体,使统计推断有意义。时间序列数据中通常代之以平稳性和弱相关性假定。

假定三:不存在完全多重共线性。任何自变量不能表示为其他自变量的线性组合。此时设计矩阵 XX 列满秩,(XX)1(X'X)^{-1} 存在。常见违反情形包括虚拟变量陷阱(为所有类别引入虚拟变量)。

假定四:零条件均值。给定自变量的值,误差项的条件期望为零:

E(uiX1i,,Xki)=0E(u_i | X_{1i}, \dots, X_{ki}) = 0

这是最关键的假定,它要求所有未观测因素与自变量不相关,即外生性。违反该假定导致内生性,使OLS估计产生偏误且不一致。常见来源包括:遗漏变量偏误联立性偏误测量误差

假定五:同方差性。给定自变量的值,误差项的条件方差恒定:

Var(uiX1i,,Xki)=σ2Var(u_i | X_{1i}, \dots, X_{ki}) = \sigma^2

违反时存在异方差性,此时OLS虽仍线性无偏但不再是BLUE,标准误需使用稳健标准误(如怀特标准误)。

经典线性模型假定

有时增加第六个假定:误差项的正态性uiN(0,σ2)u_i \sim N(0, \sigma^2)。该假定BLUE证明所需,但对小样本精确推断(t检验和F检验)至关重要。大样本下由中心极限定理保证渐近正态性。

假定与OLS性质总结

  • 假定一至四:保证OLS估计量的无偏性
  • 假定一至五(高斯-马尔可夫假定):保证OLS为BLUE
  • 假定一至六(经典线性模型假定):小样本下t检验和F检验精确有效

实践中,研究者需检验这些假定的成立情况,并在违反时采取补救措施,如使用稳健标准误广义最小二乘法工具变量法,以确保结论的可靠性。