ARTICLE
高斯-马尔可夫假定
高斯-马尔可夫假定 高斯-马尔可夫假定(Gauss-Markov Assumptions)是一组在线性回归模型框架下,用于证明普通最小二乘法(OLS)估计量为最佳线性无偏估计量(BLUE)的核心假定。这些假定构成经典线性回归模型的理论基石,其结论由高斯-马尔可夫定理阐述。 考虑多元线性回归模型: 其中 Y_i 为因变量,X_1i, , X_ki 为自变量,
高斯-马尔可夫假定
高斯-马尔可夫假定(Gauss-Markov Assumptions)是一组在线性回归模型框架下,用于证明普通最小二乘法(OLS)估计量为最佳线性无偏估计量(BLUE)的核心假定。这些假定构成经典线性回归模型的理论基石,其结论由高斯-马尔可夫定理阐述。
考虑多元线性回归模型:
其中 为因变量, 为自变量, 为待估参数, 为误差项。
五个核心假定
假定一:参数的线性性。模型必须是关于参数 的线性函数。自变量可非线性变换(如 、),但参数不能以指数、乘积等非线性形式出现。
假定二:随机抽样。样本通过随机抽样获得,观测值独立同分布(i.i.d.)。此假定确保样本代表总体,使统计推断有意义。时间序列数据中通常代之以平稳性和弱相关性假定。
假定三:不存在完全多重共线性。任何自变量不能表示为其他自变量的线性组合。此时设计矩阵 列满秩, 存在。常见违反情形包括虚拟变量陷阱(为所有类别引入虚拟变量)。
假定四:零条件均值。给定自变量的值,误差项的条件期望为零:
这是最关键的假定,它要求所有未观测因素与自变量不相关,即外生性。违反该假定导致内生性,使OLS估计产生偏误且不一致。常见来源包括:遗漏变量偏误、联立性偏误和测量误差。
假定五:同方差性。给定自变量的值,误差项的条件方差恒定:
违反时存在异方差性,此时OLS虽仍线性无偏但不再是BLUE,标准误需使用稳健标准误(如怀特标准误)。
经典线性模型假定
有时增加第六个假定:误差项的正态性,。该假定非BLUE证明所需,但对小样本精确推断(t检验和F检验)至关重要。大样本下由中心极限定理保证渐近正态性。
假定与OLS性质总结
- 假定一至四:保证OLS估计量的无偏性
- 假定一至五(高斯-马尔可夫假定):保证OLS为BLUE
- 假定一至六(经典线性模型假定):小样本下t检验和F检验精确有效
实践中,研究者需检验这些假定的成立情况,并在违反时采取补救措施,如使用稳健标准误、广义最小二乘法或工具变量法,以确保结论的可靠性。