ARTICLE

邹检验

邹检验 邹检验(Chow test)是由美籍华裔计量经济学家邹至庄(Gregory C. Chow)于 1960 年在 *Econometrica* 发表的文章中提出的统计检验方法,用于判断线性回归模型在不同子样本之间是否存在结构性突变(structural break)。所谓结构性突变,是指模型参数——截距项、斜率系数或二者兼有——在某个时点前后发生了统计

浏览 0 更新 2025-10-26

邹检验

邹检验(Chow test)是由美籍华裔计量经济学家邹至庄(Gregory C. Chow)于 1960 年在 *Econometrica* 发表的文章中提出的统计检验方法,用于判断线性回归模型在不同子样本之间是否存在结构性突变(structural break)。所谓结构性突变,是指模型参数——截距项、斜率系数或二者兼有——在某个时点前后发生了统计上显著的变化,使得单一回归方程不再足以描述整个样本的数据生成过程。

邹检验的核心思想简洁而优美:将全样本按某一已知断点划分为两个子样本,分别做回归后比较"无约束模型"与"有约束模型"的拟合优度差异。具体而言,若将数据分为两组分别回归所得残差平方和,与全样本统一回归的残差平方和相比无显著差异,则模型参数稳定,接受"无结构变化"的原假设;否则拒绝原假设,认定存在结构突变。

假设检验框架

邹检验设定如下:

  • 原假设 H0 H_0 :两个子样本的回归系数完全相同,即不存在结构性突变。换言之,全样本的一个回归方程足以刻画数据。
  • 备择假设 H1 H_1 :两个子样本的系数不全相等,至少有一个解释变量的效应在断点前后发生了改变。

检验的前提包括:① 断点位置是事先已知的,基于理论或制度背景(如一项政策实施的精确日期),而不能通过反复试验数据来事后确定;② 误差项满足经典线性回归假设——独立同分布、零均值且同方差;③ 两个子样本均满足最小样本量要求,即各自容量大于自变量个数 k k ,否则邹预测检验是更好的选择。

数学原理与统计量构造

设全样本容量为 N N ,自变量个数(含截距项)为 k k 。将数据按已知断点划分为子样本 1 1 (容量 N1 N_1 )与子样本 2 2 (容量 N2 N_2 ),N=N1+N2 N = N_1 + N_2 。分别对两个子样本进行 OLS 回归,记残差平方和为 RSS1 RSS_1 RSS2 RSS_2 ,此二者的和构成"无约束"情形下的残差平方和 RSSUR=RSS1+RSS2 RSS_{UR} = RSS_1 + RSS_2 ,自由度为 N1+N22k N_1 + N_2 - 2k 。再对全样本统一回归得 RSSpooled RSS_{\text{pooled}} (即"有约束"情形,约束条件为两子样本系数相同),自由度为 Nk N - k

邹检验的 F 统计量构造如下:

F=(RSSpooled(RSS1+RSS2))/k(RSS1+RSS2)/(N1+N22k)F(k,N1+N22k)F = \frac{(RSS_{\text{pooled}} - (RSS_1 + RSS_2)) / k}{(RSS_1 + RSS_2) / (N_1 + N_2 - 2k)} \sim F(k, N_1+N_2-2k)

分子中的差值 RSSpooled(RSS1+RSS2) RSS_{\text{pooled}} - (RSS_1 + RSS_2) 度量了施加"系数相同"约束后残差变大的幅度——约束越不合理,该差值越大。分母为无约束模型每自由度的残差变异,用作标准化的基准。该统计量在原假设 H0 H_0 成立时服从自由度为 (k,N1+N22k) (k, N_1+N_2-2k) 的 F 分布。

决策规则:给定显著性水平 α \alpha (通常取 0.05 0.05 ),若计算所得的 F F 统计量大于临界值 Fα(k,N1+N22k) F_{\alpha}(k, N_1+N_2-2k) ,则拒绝 H0 H_0 ,认为存在结构性突变;否则不拒绝 H0 H_0 ,可维持模型参数稳定的判断。也可以通过 p 值来判定:若 p<α p < \alpha 则拒绝。

计算步骤

邹检验在实证中可以按以下五步执行:

  1. 确定断点:根据理论、制度或外部事件确定候选断点的位置。例如,研究中国 2001 年入世对贸易弹性的影响,断点可设为 2001 年第四季度。
  2. 划分样本并分别回归:对断点前后的两个子样本分别做 OLS,记录各自的 RSS 和系数估计值。
  3. 全样本回归:对未划分的全样本做 OLS,记录 RSSpooled RSS_{\text{pooled}}
  4. 计算 F 统计量:代入上述公式,得出检验统计量的值。
  5. 查表或计算 p 值:与临界值比较或依 p 值作出统计决策。

前提假设与局限

邹检验的使用须满足若干严格前提,否则推断结果可能有偏:

  • 同方差性:两个子样本的误差方差须相等。若存在异方差,F 检验的显著性水平会偏离名义水平。此时可改用异方差稳健的 Wald 检验。
  • 断点外生:断点不可由"数据窥探"(data snooping)得出。若先看图再定断点然后进行邹检验,第一类错误概率会被严重低估。解决此问题的标准方法是 Quandt-Andrews 检验。
  • 线性模型框架:邹检验仅适用于线性回归。非线性模型(如 Logit、Probit)的参数稳定性需借助似然比检验或广义矩检验。
  • 子样本容量限制:若某一子样本的样本量小于 k k (即不足以独立回归),则需退而使用邹预测检验——仅基于大样本回归结果对小子样本进行预测评估。

变体与相关方法

  • 邹预测检验(Chow forecast test):当 N2<k N_2 < k 时适用。仅对子样本 1 回归,然后用所得模型预测子样本 2 的因变量,构造预测误差的 F 统计量。
  • Quandt-Andrews 检验:当断点未知时,在样本中间区间(通常剔除首尾各 15\%)逐点计算邹检验统计量,取最大 Wald 统计量(Sup-Wald),由非标准分布给出临界值。
  • CUSUM 与 CUSUMSQ 检验:基于递归残差的累积和,无需预先指定断点。CUSUM 对截距变化敏感,CUSUMSQ 对方差变化敏感。
  • Bai-Perron 方法:允许多个未知断点的联合估计与检验,是结构突变文献中 R 和 Stata 均有实现的高级工具。

应用场景

邹检验广泛应用于:宏观经济学中识别经济周期的转折点;发展经济学中评估政策干预的效果(如最低工资法、税制改革前后工资方程的稳定性);金融学中检验金融危机前后资产定价模型的结构变化;政治经济学中分析选举或政权更迭对经济变量关系的影响。在现代因果推断框架中,邹检验也常作为断点回归设计或双重差分的前置稳健性检验工具。

> 邹检验是实证计量经济学中经久不衰的基础工具。它简洁的 F 检验形式、清晰的直觉和广泛的软件支持(EViews、Stata 的 \texttt{chow} 命令、R 的 \texttt{strucchange} 包),使其成为每一位实证研究者在面对"模型参数是否稳定"这一根本性问题时的首选方法。