ARTICLE

一般线性模型

一般线性模型 (General Linear Model) 一般线性模型（General Linear Model，简称 GLM）是统计学中一类核心的建模框架，它将线性回归模型、方差分析（ANOVA）、协方差分析（ANCOVA）以及 t 检验等多种经典统计方法统一在同一数学体系之下。模型的基本形式为：公式其中公式是公式的因变量向量，公式是公

浏览 0 更新 2025-11-08

一般线性模型 (General Linear Model)

一般线性模型（General Linear Model，简称 GLM）是统计学中一类核心的建模框架，它将线性回归模型、方差分析（ANOVA）、协方差分析（ANCOVA）以及 t 检验等多种经典统计方法统一在同一数学体系之下。模型的基本形式为：

\mathbf{y} = \mathbf{X}\boldsymbol{\beta} + \boldsymbol{\varepsilon}

其中 $\mathbf{y}$ 是 $n \times 1$ 的因变量向量， $\mathbf{X}$ 是 $n \times p$ 的设计矩阵，包含自变量、虚拟变量及交互项； $\boldsymbol{\beta}$ 是 $p \times 1$ 的未知参数向量； $\boldsymbol{\varepsilon}$ 是 $n \times 1$ 的随机误差向量。核心假定包括： $\mathbb{E}[\boldsymbol{\varepsilon}] = \mathbf{0}$ （零均值）、 $\operatorname{Var}[\boldsymbol{\varepsilon}] = \sigma^2\mathbf{I}_n$ （同方差且无自相关），以及 $\mathbf{X}$ 列满秩（ $\operatorname{rank}(\mathbf{X}) = p < n$ ）。当进一步假定 $\boldsymbol{\varepsilon} \sim N(\mathbf{0}, \sigma^2\mathbf{I})$ 时，可进行精确的有限样本推断。

参数估计与Gauss-Markov定理

普通最小二乘法（OLS）通过最小化残差平方和来估计参数：

\hat{\boldsymbol{\beta}}_{\text{OLS}} = (\mathbf{X}'\mathbf{X})^{-1}\mathbf{X}'\mathbf{y}

Gauss-Markov定理保证，在经典假定下，OLS估计量是所有线性无偏估计量中方差最小的（BLUE）。误差方差的无偏估计量为 $\hat{\sigma}^2 = \text{RSS}/(n-p)$ ，其中 $\text{RSS}$ 为残差平方和。

从几何角度看， $\mathbf{y}$ 是 $\mathbb{R}^n$ 中的向量， $\mathbf{X}$ 的列张成 $p$ 维子空间， $\hat{\mathbf{y}} = \mathbf{X}\hat{\boldsymbol{\beta}}$ 是 $\mathbf{y}$ 在该子空间上的正交投影，残差向量 $\hat{\boldsymbol{\varepsilon}} = \mathbf{y} - \hat{\mathbf{y}}$ 垂直于该子空间。这一分解对应着平方和分解： $\mathbf{y}'\mathbf{y} = \hat{\mathbf{y}}'\hat{\mathbf{y}} + \hat{\boldsymbol{\varepsilon}}'\hat{\boldsymbol{\varepsilon}}$ 。

假设检验与方差分析

在正态性假定下，单个系数的显著性用 t 检验： $t = \hat{\beta}_j / \operatorname{SE}(\hat{\beta}_j) \sim t_{n-p}$ 。对于一般线性约束 $H_0: \mathbf{R}\boldsymbol{\beta} = \mathbf{r}$ ，使用 F 检验：

F = \frac{(\text{RSS}_r - \text{RSS}_u) / q}{\text{RSS}_u / (n - p)} \sim F_{q, \, n-p}

回归整体的 F 检验（除截距外所有系数为零）的统计量为 $F = \frac{R^2/(p-1)}{(1-R^2)/(n-p)} \sim F_{p-1, n-p}$ ，其中 $R^2$ 为决定系数，度量模型对因变量变异的解释比例。

与特殊模型的关系

一般线性模型具有强大的统一性。简单线性回归和多元线性回归是其直接特例。单因素方差分析等价于因变量对一组虚拟变量的回归。双因素方差分析还包含交互项。协方差分析（ANCOVA）在分类变量基础上加入连续型协变量。独立样本 t 检验等价于分组虚拟变量的回归（t² = F）。因此，GLM 为理解这些方法的内在统一性提供了理论视角。

模型诊断与扩展

模型有效性依赖对假定的检验。常用诊断包括：残差图检测异方差和非线性；Q-Q图和Shapiro-Wilk检验评估正态性；Durbin-Watson检验检测自相关；方差膨胀因子（VIF）诊断多重共线性。修正策略包括：Huber-White稳健标准误应对异方差；广义最小二乘法（GLS）处理自相关；岭回归或LASSO缓解多重共线性。一般线性模型的推广是广义线性模型（Generalized Linear Model），通过连接函数和指数族分布将因变量扩展至二分类、计数等非连续数据类型，极大拓展了线性建模的应用边界。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。