ARTICLE

游程检验

游程检验 (Runs Test) 游程检验(Runs Test),也称为沃尔德-沃尔夫维茨游程检验或吉尔里游程检验,是一种重要的非参数统计检验方法。它的主要目的是判断一个数据序列是否具有随机性(Randomness)。在计量经济学、时间序列分析以及一般的统计推断中,经常需要假设样本是随机抽取的,或者模型的残差是相互独立的。游程检验不依赖于总体的具体分布形式,

浏览 4 更新 2025-11-28

游程检验 (Runs Test)

游程检验(Runs Test),也称为沃尔德-沃尔夫维茨游程检验或吉尔里游程检验,是一种重要的非参数统计检验方法。它的主要目的是判断一个数据序列是否具有随机性(Randomness)。在计量经济学时间序列分析以及一般的统计推断中,经常需要假设样本是随机抽取的,或者模型的残差是相互独立的。游程检验不依赖于总体的具体分布形式,因此在处理定性数据或分布未知的定量数据时非常有用。

核心概念

在一个由两类元素(如符号"+"和"-"、或"0"和"1")组成的序列中,一个游程是指由相同符号组成的连续子序列,该子序列的前后元素均与该子序列的符号不同。游程长度为一个游程中包含的元素个数,游程数RR为整个序列中游程的总个数。例如序列HHH TT H TTTT HH包含5个游程(R=5R = 5),第一个游程有3个H、长度为3。

游程检验的核心直觉是:如果一个序列完全随机,同类元素不应过度聚集(导致游程数过少),也不应有规律地交替出现(导致游程数过多)。游程数过少意味着同类元素成团出现,表明序列中可能存在趋势或正自相关;游程数过多意味着元素频繁跳变,表明可能存在系统性震荡或负自相关。

检验假设与统计量

假设检验设定为:零假设H0H_0为该序列随机生成(元素相互独立),备择假设H1H_1为该序列不随机。假设序列中第一类元素个数为n1n_1,第二类为n2n_2,总样本量n=n1+n2n = n_1 + n_2

小样本情况n1,n2n_1, n_2均小于20):利用组合数学计算游程数RR概率分布,通过查游程检验临界值表判断显著性。若RRcriticallowerR \le R_{critical_lower}RRcriticalupperR \ge R_{critical_upper}则拒绝零假设。

大样本情况n1,n2n_1, n_2均大于10):游程数RR的抽样分布近似服从正态分布。在随机性零假设下,RR的期望值和方差分别为:

μR=2n1n2n1+n2+1,σR2=2n1n2(2n1n2n1n2)(n1+n2)2(n1+n21)\mu_R = \frac{2n_1 n_2}{n_1 + n_2} + 1, \quad \sigma_R^2 = \frac{2n_1 n_2 (2n_1 n_2 - n_1 - n_2)}{(n_1 + n_2)^2 (n_1 + n_2 - 1)}

由此构造标准化检验统计量Z=(RμR)/σRZ = (R - \mu_R) / \sigma_R,渐近服从标准正态分布N(0,1)N(0, 1)。根据显著性水平α\alpha和双尾或单尾检验设定,将Z|Z|与临界值比较做出判断。

应用与注意事项

游程检验在多个领域有重要应用。在时间序列分析中,检验残差的随机性——若残差序列拒绝随机性假设,表明模型未充分捕获数据中的自相关结构,需重新设定模型或引入滞后项。在金融学中,检验股票收益率的随机性——若收益序列不随机(表现出趋势或反转模式),则可能挑战有效市场假说。在质量控制中,检验生产过程是否处于统计受控状态。在回归诊断中,通过分析残差符号游程检验是否存在自相关模型误设

使用游程检验需注意:连续变量需先通过相对于某个阈值(如中位数、均值)的分类转换为二分变量——阈值选择会略微影响检验结果。游程检验主要检测正自相关或负自相关形式的非随机性,对其他形式的非随机模式(如确定性周期)敏感性较低。它是一种非参数方法,效力通常低于基于正态假定的参数检验,但在分布假设不成立时更为稳健。