ARTICLE
邹检验
邹检验 邹检验(Chow test)是由美籍华裔计量经济学家邹至庄(Gregory C. Chow)于 1960 年在 *Econometrica* 发表的文章中提出的统计检验方法,用于判断线性回归模型在不同子样本之间是否存在结构性突变(structural break)。所谓结构性突变,是指模型参数——截距项、斜率系数或二者兼有——在某个时点前后发生了统计
邹检验
邹检验(Chow test)是由美籍华裔计量经济学家邹至庄(Gregory C. Chow)于 1960 年在 *Econometrica* 发表的文章中提出的统计检验方法,用于判断线性回归模型在不同子样本之间是否存在结构性突变(structural break)。所谓结构性突变,是指模型参数——截距项、斜率系数或二者兼有——在某个时点前后发生了统计上显著的变化,使得单一回归方程不再足以描述整个样本的数据生成过程。
邹检验的核心思想简洁而优美:将全样本按某一已知断点划分为两个子样本,分别做回归后比较"无约束模型"与"有约束模型"的拟合优度差异。具体而言,若将数据分为两组分别回归所得残差平方和,与全样本统一回归的残差平方和相比无显著差异,则模型参数稳定,接受"无结构变化"的原假设;否则拒绝原假设,认定存在结构突变。
假设检验框架
邹检验设定如下:
- 原假设 :两个子样本的回归系数完全相同,即不存在结构性突变。换言之,全样本的一个回归方程足以刻画数据。
- 备择假设 :两个子样本的系数不全相等,至少有一个解释变量的效应在断点前后发生了改变。
检验的前提包括:① 断点位置是事先已知的,基于理论或制度背景(如一项政策实施的精确日期),而不能通过反复试验数据来事后确定;② 误差项满足经典线性回归假设——独立同分布、零均值且同方差;③ 两个子样本均满足最小样本量要求,即各自容量大于自变量个数 ,否则邹预测检验是更好的选择。
数学原理与统计量构造
设全样本容量为 ,自变量个数(含截距项)为 。将数据按已知断点划分为子样本 (容量 )与子样本 (容量 ),。分别对两个子样本进行 OLS 回归,记残差平方和为 与 ,此二者的和构成"无约束"情形下的残差平方和 ,自由度为 。再对全样本统一回归得 (即"有约束"情形,约束条件为两子样本系数相同),自由度为 。
邹检验的 F 统计量构造如下:
分子中的差值 度量了施加"系数相同"约束后残差变大的幅度——约束越不合理,该差值越大。分母为无约束模型每自由度的残差变异,用作标准化的基准。该统计量在原假设 成立时服从自由度为 的 F 分布。
决策规则:给定显著性水平 (通常取 ),若计算所得的 统计量大于临界值 ,则拒绝 ,认为存在结构性突变;否则不拒绝 ,可维持模型参数稳定的判断。也可以通过 p 值来判定:若 则拒绝。
计算步骤
邹检验在实证中可以按以下五步执行:
- 确定断点:根据理论、制度或外部事件确定候选断点的位置。例如,研究中国 2001 年入世对贸易弹性的影响,断点可设为 2001 年第四季度。
- 划分样本并分别回归:对断点前后的两个子样本分别做 OLS,记录各自的 RSS 和系数估计值。
- 全样本回归:对未划分的全样本做 OLS,记录 。
- 计算 F 统计量:代入上述公式,得出检验统计量的值。
- 查表或计算 p 值:与临界值比较或依 p 值作出统计决策。
前提假设与局限
邹检验的使用须满足若干严格前提,否则推断结果可能有偏:
- 同方差性:两个子样本的误差方差须相等。若存在异方差,F 检验的显著性水平会偏离名义水平。此时可改用异方差稳健的 Wald 检验。
- 断点外生:断点不可由"数据窥探"(data snooping)得出。若先看图再定断点然后进行邹检验,第一类错误概率会被严重低估。解决此问题的标准方法是 Quandt-Andrews 检验。
- 线性模型框架:邹检验仅适用于线性回归。非线性模型(如 Logit、Probit)的参数稳定性需借助似然比检验或广义矩检验。
- 子样本容量限制:若某一子样本的样本量小于 (即不足以独立回归),则需退而使用邹预测检验——仅基于大样本回归结果对小子样本进行预测评估。
变体与相关方法
- 邹预测检验(Chow forecast test):当 时适用。仅对子样本 1 回归,然后用所得模型预测子样本 2 的因变量,构造预测误差的 F 统计量。
- Quandt-Andrews 检验:当断点未知时,在样本中间区间(通常剔除首尾各 15\%)逐点计算邹检验统计量,取最大 Wald 统计量(Sup-Wald),由非标准分布给出临界值。
- CUSUM 与 CUSUMSQ 检验:基于递归残差的累积和,无需预先指定断点。CUSUM 对截距变化敏感,CUSUMSQ 对方差变化敏感。
- Bai-Perron 方法:允许多个未知断点的联合估计与检验,是结构突变文献中 R 和 Stata 均有实现的高级工具。
应用场景
邹检验广泛应用于:宏观经济学中识别经济周期的转折点;发展经济学中评估政策干预的效果(如最低工资法、税制改革前后工资方程的稳定性);金融学中检验金融危机前后资产定价模型的结构变化;政治经济学中分析选举或政权更迭对经济变量关系的影响。在现代因果推断框架中,邹检验也常作为断点回归设计或双重差分的前置稳健性检验工具。
> 邹检验是实证计量经济学中经久不衰的基础工具。它简洁的 F 检验形式、清晰的直觉和广泛的软件支持(EViews、Stata 的 \texttt{chow} 命令、R 的 \texttt{strucchange} 包),使其成为每一位实证研究者在面对"模型参数是否稳定"这一根本性问题时的首选方法。