ARTICLE

经典正态线性回归模型 (Classical Normal Linear Regression Model, CNLRM)

经典正态线性回归模型 (Classical Normal Linear Regression Model, CNLRM) 经典正态线性回归模型(Classical Normal Linear Regression Model, CNLRM)是在经典线性回归模型 (CLRM) 的全部假设之上,额外施加误差项服从正态分布假设而得到的模型。这一正态性假设使得我们能

浏览 0 更新 2025-10-26

经典正态线性回归模型 (Classical Normal Linear Regression Model, CNLRM)

经典正态线性回归模型(Classical Normal Linear Regression Model, CNLRM)是在经典线性回归模型 (CLRM) 的全部假设之上,额外施加误差项服从正态分布假设而得到的模型。这一正态性假设使得我们能够推导出估计量的精确(小样本)分布,从而进行严格的假设检验区间估计

模型与核心假设

模型形式与 CLRM 相同:

y=Xβ+ϵ\mathbf{y} = X\boldsymbol{\beta} + \boldsymbol{\epsilon}

在 CLRM 的线性性、严格外生性、同方差性、无自相关、无完全多重共线性等假设基础上,CNLRM 增加关键的正态性假设:

ϵXN(0,σ2I)\boldsymbol{\epsilon} \mid X \sim N(\mathbf{0}, \sigma^2 I)

即误差项是均值为零、协方差矩阵为 σ2I\sigma^2 I 的多元正态随机向量。

正态性假设的意义

正态性假设带来一系列重要的精确分布结果:

  1. 估计量的正态性:OLS 估计量 β^=(XTX)1XTy\hat{\boldsymbol{\beta}} = (X^TX)^{-1}X^T\mathbf{y} 服从正态分布 β^N(β,σ2(XTX)1)\hat{\boldsymbol{\beta}} \sim N(\boldsymbol{\beta}, \sigma^2 (X^TX)^{-1}),且这一结论在任意有限样本下精确成立,而非仅渐近成立。
  2. t 分布:标准化的单个系数估计量服从 tt 分布,β^jβjse^(β^j)tnk\dfrac{\hat{\beta}_j - \beta_j}{\hat{\operatorname{se}}(\hat{\beta}_j)} \sim t_{n-k},这是 tt 检验的理论依据。
  3. F 分布:检验多个线性约束的统计量服从 FF 分布,为联合假设检验提供基础。
  4. 卡方分布(nk)σ^2σ2χnk2\dfrac{(n-k)\hat{\sigma}^2}{\sigma^2} \sim \chi^2_{n-k},用于关于误差方差的推断。

极大似然与OLS的关系

在正态性假设下,OLS 估计量与极大似然估计量重合。对回归系数 β\boldsymbol{\beta} 而言,极大化正态似然函数等价于极小化残差平方和,因此 β^MLE=β^OLS\hat{\boldsymbol{\beta}}_{MLE} = \hat{\boldsymbol{\beta}}_{OLS}。这一等价性赋予 OLS 估计量在正态假设下额外的渐近有效性——它达到克拉默-拉奥下界

正态性的检验与放宽

正态性假设可通过雅克-贝拉检验 (Jarque-Bera Test)、夏皮罗-威尔克检验或残差的 Q-Q 图进行检验。当样本量较大时,根据中心极限定理,即便误差不严格服从正态分布,OLS 估计量的抽样分布仍渐近正态,因此 tt 检验和 FF 检验在大样本下近似有效。这意味着正态性假设主要在小样本精确推断中才至关重要。