ARTICLE
游程检验
游程检验 (Runs Test) 游程检验(Runs Test),也称为沃尔德-沃尔夫维茨游程检验或吉尔里游程检验,是一种重要的非参数统计检验方法。它的主要目的是判断一个数据序列是否具有随机性(Randomness)。在计量经济学、时间序列分析以及一般的统计推断中,经常需要假设样本是随机抽取的,或者模型的残差是相互独立的。游程检验不依赖于总体的具体分布形式,
游程检验 (Runs Test)
游程检验(Runs Test),也称为沃尔德-沃尔夫维茨游程检验或吉尔里游程检验,是一种重要的非参数统计检验方法。它的主要目的是判断一个数据序列是否具有随机性(Randomness)。在计量经济学、时间序列分析以及一般的统计推断中,经常需要假设样本是随机抽取的,或者模型的残差是相互独立的。游程检验不依赖于总体的具体分布形式,因此在处理定性数据或分布未知的定量数据时非常有用。
核心概念
在一个由两类元素(如符号"+"和"-"、或"0"和"1")组成的序列中,一个游程是指由相同符号组成的连续子序列,该子序列的前后元素均与该子序列的符号不同。游程长度为一个游程中包含的元素个数,游程数为整个序列中游程的总个数。例如序列HHH TT H TTTT HH包含5个游程(),第一个游程有3个H、长度为3。
游程检验的核心直觉是:如果一个序列完全随机,同类元素不应过度聚集(导致游程数过少),也不应有规律地交替出现(导致游程数过多)。游程数过少意味着同类元素成团出现,表明序列中可能存在趋势或正自相关;游程数过多意味着元素频繁跳变,表明可能存在系统性震荡或负自相关。
检验假设与统计量
假设检验设定为:零假设为该序列随机生成(元素相互独立),备择假设为该序列不随机。假设序列中第一类元素个数为,第二类为,总样本量。
小样本情况(均小于20):利用组合数学计算游程数的概率分布,通过查游程检验临界值表判断显著性。若或则拒绝零假设。
大样本情况(均大于10):游程数的抽样分布近似服从正态分布。在随机性零假设下,的期望值和方差分别为:
由此构造标准化检验统计量,渐近服从标准正态分布。根据显著性水平和双尾或单尾检验设定,将与临界值比较做出判断。
应用与注意事项
游程检验在多个领域有重要应用。在时间序列分析中,检验残差的随机性——若残差序列拒绝随机性假设,表明模型未充分捕获数据中的自相关结构,需重新设定模型或引入滞后项。在金融学中,检验股票收益率的随机性——若收益序列不随机(表现出趋势或反转模式),则可能挑战有效市场假说。在质量控制中,检验生产过程是否处于统计受控状态。在回归诊断中,通过分析残差符号游程检验是否存在自相关或模型误设。
使用游程检验需注意:连续变量需先通过相对于某个阈值(如中位数、均值)的分类转换为二分变量——阈值选择会略微影响检验结果。游程检验主要检测正自相关或负自相关形式的非随机性,对其他形式的非随机模式(如确定性周期)敏感性较低。它是一种非参数方法,效力通常低于基于正态假定的参数检验,但在分布假设不成立时更为稳健。