ARTICLE
雅克-贝拉检验
雅克-贝拉检验 (Jarque-Bera Test) 雅克-贝拉检验(Jarque-Bera Test,简称JB检验)是一种正态性检验,用于判断一组样本数据是否来自正态分布。该检验由澳大利亚经济学家Carlos Jarque和印度裔统计学家Anil K. Bera于1980年提出,是计量经济学和统计学中应用最为广泛的正态性诊断工具之一。JB检验的核心思想在于
雅克-贝拉检验 (Jarque-Bera Test)
雅克-贝拉检验(Jarque-Bera Test,简称JB检验)是一种正态性检验,用于判断一组样本数据是否来自正态分布。该检验由澳大利亚经济学家Carlos Jarque和印度裔统计学家Anil K. Bera于1980年提出,是计量经济学和统计学中应用最为广泛的正态性诊断工具之一。JB检验的核心思想在于:正态分布的偏度(Skewness)为0、峰度(Kurtosis)为3,若样本的偏度和峰度与这些基准值存在显著偏离,则拒绝正态性假设。
检验的直观逻辑
正态分布是对称的钟形曲线,其两个重要数值特征为偏度和峰度。偏度衡量分布的不对称性:正偏(右偏)意味着右侧尾部更长,负偏(左偏)意味着左侧尾部更长,对称分布的偏度为零。峰度衡量尾部的厚度:正态分布的峰度为3(超值峰度通常报告为超额峰度,即峰度减3),峰度大于3称为"厚尾",小于3称为"薄尾"。
JB检验将样本的偏度和峰度同时纳入考量,构建一个综合统计量。若数据确实来自正态分布,则样本偏度应接近0、样本峰度应接近3,JB统计量应较小。反之,若偏度显著偏离0、峰度显著偏离3,JB统计量将变大,从而有充分证据拒绝正态性假设。
统计原理
样本偏度与样本峰度
设 为独立同分布的样本,样本均值为 。样本偏度(Sample Skewness)定义为:
样本峰度(Sample Kurtosis)定义为:
对于正态分布,有 ,,且偏度和峰度的渐近方差分别为 和 。
检验统计量
JB检验统计量综合偏度与峰度的偏离程度,其计算公式为:
其中 为样本容量。在零假设(数据服从正态分布)下,JB统计量渐近服从自由度为2的卡方分布:
统计量中的第一项 惩罚偏度偏离零的行为,第二项 惩罚峰度偏离3的行为。两项均被放大 倍,因此样本量越大,对偏离正态性的敏感度越高。
决策规则
给定显著性水平 (通常取0.05),查 分布的临界值 。若 ,则拒绝零假设,认为数据不服从正态分布;否则不拒绝零假设。也可计算p值:若 则拒绝零假设。
应用与局限性
主要应用场景
JB检验在以下领域有广泛应用:
- 回归诊断:在普通最小二乘法(OLS)回归中,误差项的正态性是进行精确假设检验和构建置信区间的关键前提。JB检验常用于检验OLS残差的正态性。
- 金融数据分析:金融时间序列(如股票收益率)通常呈现厚尾和非对称特征,JB检验可帮助判断是否偏离正态分布,从而决定是否采用GARCH模型等更贴合的建模方法。
- 风险管理:风险价值(VaR)等指标的准确计算依赖于收益率的分布假定,JB检验为分布假定提供了诊断工具。
- 质量控制:在统计过程控制中,许多控制图假定过程输出服从正态分布,JB检验可用于验证该假定。
局限性
JB检验并非在所有情形中都表现最优:
- 小样本偏误:JB检验基于渐近理论,在小样本()中检验的第一类错误率可能偏离名义水平,实际拒绝频率可能偏高。Urzúa (1996) 和 Doornik \& Hansen (2008) 提出了适用于小样本的修正版本。
- 对极端值的敏感性:偏度和峰度对异常值极为敏感,单个极端值可能导致JB统计量大幅膨胀,产生错误的拒绝结论。因此使用前应检查数据中是否存在异常观测。
- 不是特异性检验:JB检验将偏度和峰度合为一个综合统计量,拒绝正态性后无法直接判断是偏度还是峰度的偏离所致。可分别考察偏度和峰度的显著性作为补充。
- 对分布形状的局限:JB检验仅针对偏度和峰度这两个矩(第三、四阶矩),无法检测更高阶矩上的偏离正态性。在特殊情形下,某些非正态分布可能恰好具有与正态分布相同的偏度和峰度,导致JB检验失效。
与其他正态性检验的比较
除了JB检验,常用的正态性检验还包括:
- Shapiro-Wilk检验:基于次序统计量的方差比,在小样本中功效较高,是公认的小样本最优正态性检验之一。但在大样本中计算量较大。
- Kolmogorov-Smirnov检验:基于经验分布函数与理论分布函数的最大差异,但需要指定分布的均值和方差,且对正态性偏离的敏感度通常低于JB检验和Shapiro-Wilk检验。
- Anderson-Darling检验:类似于K-S检验,但对尾部差异赋予更大权重,在检测厚尾分布时功效较高。
- Lilliefors检验:K-S检验的修正版本,适用于均值和方差未知的正态性检验。
一般而言,在中等及以上样本()中,JB检验因其计算简便、无需查特殊临界值表(直接使用分布)而受到广泛应用。多数现代统计软件(如Stata、EViews、R语言、Python的scipy.stats模块)均内置了JB检验。
实例说明
假设某数据集包含100个观测值,计算出样本偏度 ,样本峰度 。则:
= 100 \times (0.03375 + 0.02802) = 6.177 查 分布表,5\%显著性水平下的临界值为5.991。由于 ,拒绝正态性假设,认为数据在5\%显著性水平下不服从正态分布。
综上所述,雅克-贝拉检验通过考察样本的偏度和峰度是否与正态分布一致,提供了一个简洁而有效的正态性诊断工具。尽管存在小样本偏误等局限性,其计算简单、直观易解且在大样本中表现良好的特点,使其成为实证分析中不可或缺的正态性检验方法。