ARTICLE
经典线性回归模型假设
经典线性回归模型假设 (Assumptions of CLRM) 经典线性回归模型(Classical Linear Regression Model,CLRM)是计量经济学和统计学中最基础的分析框架之一。为了保证普通最小二乘法得到的估计量具有良好的统计性质,包括无偏性、有效性和一致性,需要对模型的数据生成过程和误差项作出一系列严格假设。这些假设被称为高斯-
经典线性回归模型假设 (Assumptions of CLRM)
经典线性回归模型(Classical Linear Regression Model,CLRM)是计量经济学和统计学中最基础的分析框架之一。为了保证普通最小二乘法得到的估计量具有良好的统计性质,包括无偏性、有效性和一致性,需要对模型的数据生成过程和误差项作出一系列严格假设。这些假设被称为高斯-马尔可夫假设。深入理解这些假设对于诊断模型缺陷、处理异方差或内生性等问题至关重要。
高斯-马尔可夫五大假设
模型设定为矩阵形式 ,其中 为n维因变量向量, 为n乘p的设计矩阵, 为p维系数向量, 为n维误差向量。
假设一:线性性。模型在参数上是线性的,即 。需要注意的是,回归元本身可以包含非线性变换,例如 或 ,只要方程形式对系数 保持线性即可。
假设二:严格外生性。条件期望满足 ,即误差项的条件均值不依赖于任何观测到的回归元。这一假设确保了解释变量与误差项不相关,是OLS估计量无偏性的核心保证。
假设三:无完全多重共线性。设计矩阵 必须是列满秩的,其秩为p,从而 可逆,OLS解 唯一存在。这意味着所有回归元之间必须满足线性无关。
假设四:球面误差方差。该假设包含两个部分:条件同方差 ,即误差方差恒定;以及无条件不相关 (对于i不等于j),即不存在自相关。两者合并可写为 ,其中 为n维单位矩阵。高斯-马尔可夫定理在此条件下保证OLS估计量为最佳线性无偏估计量(BLUE)。
假设五:误差正态性(可选附加假设)。。在假设一至四的基础上添加正态性假设后,OLS估计量 的精确有限样本分布即为正态分布,t检验和F检验的有限样本精确性由此得到保证。然而,在大样本条件下,中心极限定理保证了即使不假设正态性,t检验和F检验的近似仍然成立。因此,正态性假设主要用于小样本推断。
假设违反的后果与诊断
假设二的违反,即内生性问题,通常由遗漏变量偏差、测量误差或同时性引起,是最为致命的情形。此时OLS估计量不再具有一致性,需要使用工具变量方法(IV或2SLS)来补救。假设四的违反包含两种情形。异方差使OLS估计量仍然无偏但不再有效,标准误存在偏差,Huber-White稳健标准误是最常用的补救手段。自相关同样使OLS无偏但不有效,可采用Newey-West或聚类标准误等方法处理。假设三的违反即完全多重共线性,最常见的原因是虚拟变量陷阱,解决方法是去掉一个参考类别或使用标准化约束。
CLRM假设构成了计量经济学实证研究的诊断清单。细致检查每一项假设是否满足,是严谨实证分析中"了解你的数据"和"检验你的假设"原则的实践基础。