ARTICLE
Goldfeld-Quandt 检验
Goldfeld-Quandt 检验 Goldfeld-Quandt 检验(Goldfeld-Quandt Test,简称 G-Q 检验)是由 Stephen Goldfeld 与 Richard Quandt 于 1965 年在《Journal of the American Statistical Association》上提出的用于检测线性回归模型中异
Goldfeld-Quandt 检验
Goldfeld-Quandt 检验(Goldfeld-Quandt Test,简称 G-Q 检验)是由 Stephen Goldfeld 与 Richard Quandt 于 1965 年在《Journal of the American Statistical Association》上提出的用于检测线性回归模型中异方差性(Heteroskedasticity)的经典参数检验方法。其核心思想是:若误差项的方差随某个解释变量的增大而系统性变化,则将样本按该变量排序后分为两组分别估计,两组的残差平方和之比应显著偏离 1。G-Q 检验是计量经济学教学中最早引入的异方差检验之一,也是理解异方差诊断逻辑的重要起点。
检验背景与动机
在经典线性回归模型 中,普通最小二乘法(OLS)的估计量在满足 Gauss-Markov 假设时具有最优线性无偏性(BLUE)。其中同方差假设要求 对所有 恒为常数。当这一假设被违反——即出现异方差时——OLS 估计量虽仍保持无偏性与一致性,但不再具有最小方差,导致标准误估计有偏,进而使 检验、 检验与置信区间失效。
Goldfeld 与 Quandt 观察到,许多经济数据中的异方差呈现单调型特征:误差方差随某一解释变量(如收入、企业规模)的增大而单调递增或递减。例如,在家庭消费对收入的回归中,高收入家庭的消费波动通常大于低收入家庭;在企业利润对规模的回归中,大企业的利润离散程度往往超过小企业。G-Q 检验正是针对这类单调型异方差而设计,通过将样本"对半切开"后比较两组子样本的残差离散度来做出判断。
检验原理与前提假设
G-Q 检验的构造逻辑简洁而直观。设怀疑异方差与某个解释变量 相关(方差为 的单调函数),则基本策略为:
- 将全部 个观测按 的取值从小到大排序。
- 在排序后的序列中,省略中间 个观测(通常 ),以提高两组间方差差异的对比度。
- 对前 个观测(低 组)和后 个观测(高 组)分别进行 OLS 回归,获得各自的残差平方和 与 。
- 构造 统计量:在递增型异方差的备择假设下,检验统计量为 ;若怀疑为递减型异方差,则颠倒分子分母。
G-Q 检验依赖于以下关键假设:
- 正态性假设:误差项 服从正态分布,这是 统计量精确成立的依据。
- 独立性假设:各观测的误差项相互独立。
- 排序变量已知:需事先指定怀疑引起异方差的解释变量,且该变量与误差方差之间的关系为单调函数。
- 样本足够大:需要足够多的观测以保证省略中间部分后两组子样本各自仍有足够的自由度进行回归估计。
检验统计量与决策规则
在原假设 (同方差)下,若误差正态且两组子样本独立,则检验统计量
服从自由度为 的 分布,其中 为回归模型中待估参数个数(含截距项)。注意此处 与 已除以各自自由度,但在两组子样本容量相等()时,自由度约分后统计量直接等于残差平方和之比。
决策规则:给定显著性水平 ,若 ,则拒绝同方差原假设,判定存在单调递增型异方差。若备择假设为递减型,则以 构造统计量,比较方向相应调整。由于 分布本身为右偏分布,这种单侧检验的设定与异方差方向性假设一致。
省略中间观测的作用
G-Q 检验中刻意省略中间 个观测的设计是其区别于简单两分组比较的关键特征。其统计动机在于:若方差确实随 单调递增,中间区域的观测方差介于最低组与最高组之间,将它们纳入任一组都会稀释两组之间的方差差异,降低检验的功效(Power)。Goldfeld 与 Quandt 通过蒙特卡洛模拟建议 ,即省略约四分之一的中间观测,实践中也常取 或根据样本量灵活调整。省略比例越大,两组差异越鲜明,但代价是自由度损失——在有限样本中需在对比度与估计精度之间权衡。
优点与局限性
优点:G-Q 检验的构造原理直观透明,仅需 普通最小二乘法 与 分布的基本知识即可理解和实施;对单调型异方差具有令人满意的检验功效;在样本量充足时表现稳健。
局限性则较为显著:
- 仅适用于单调型异方差:若异方差呈现 U 形、倒 U 形或其他非单调模式(如方差在中间区域最大),G-Q 检验几乎完全失效。这是其最根本的局限。
- 依赖排序变量的事先指定:检验结果对所选的排序变量高度敏感。若异方差实际由另一个未考虑的变量驱动,G-Q 检验可能无法检出。
- 对正态性假设敏感: 统计量的精确分布依赖于误差正态性。在小样本中偏离正态性可能扭曲检验水平;大样本下虽渐近稳健,但此时 Breusch-Pagan 检验 或 White 检验 通常更为合适。
- 中间省略的随意性: 的选择具有一定主观性,不同的省略比例可能导致不同的检验结论——尽管实践中这种差异通常不大。
- 仅限单一排序变量:当异方差与多个解释变量同时相关时,G-Q 检验难以刻画复杂的方差结构。
与其他异方差检验的比较
G-Q 检验与另两种主流异方差检验——Breusch-Pagan 检验(B-P 检验)与 White 检验——构成了计量经济学中异方差诊断的三大经典方法。B-P 检验通过将残差平方对解释变量做辅助回归来检验异方差,能检测方差与多个变量之间的线性关系,但不预设单调性;White 检验在 B-P 基础上进一步加入解释变量的平方项与交叉项,可检测更广泛的方差结构形式,但代价是参数消耗快、在小样本中功效衰减。相比之下,G-Q 检验在单调型异方差场景下更为简洁高效,但在通用性上逊于 B-P 与 White 检验。实践中,三种检验常结合使用:当理论或先验知识强烈暗示方差沿某一特定维度单调变化时,G-Q 检验是最自然的首选;若异方差形式未知,则优先考虑 White 检验。
应用示例
以企业研发支出对销售额的回归为例。直觉上,大企业的研发支出波动可能远大于小企业——既可能出现巨额研发投入,也可能因战略调整而缩减研发。怀疑异方差随销售额单调递增,采用 G-Q 检验:将 家企业按销售额升序排列,省略中间 家,对前 22 家(低销售额组)和后 22 家(高销售额组)分别回归研发支出,得 ,。计算 ,自由度为 。查 分布表, 临界值约为 。,拒绝同方差原假设,确认存在随销售额递增的异方差。后续估计应考虑使用 加权最小二乘法(WLS)或异方差稳健标准误。
总结
Goldfeld-Quandt 检验是计量经济学中诊断单调型异方差的经典工具。它以简洁的"分组对比"逻辑、明确的 检验框架和对特定方差结构的高功效,在半个多世纪的教学与实证研究中保持了持久的影响力。尽管其单调性依赖、排序变量敏感性和正态假设等局限使其在当代大样本、高维数据环境中已不如 White 检验 等通用方法流行,但理解 G-Q 检验对于把握异方差诊断的核心直觉——比较不同子群体的残差离散度——具有不可替代的教学价值,是深入学习更复杂异方差处理方法(如 广义最小二乘法、异方差-自相关稳健标准误 HAC 等)的必要前提。