ARTICLE

雅克-贝拉检验

雅克-贝拉检验 (Jarque-Bera Test) 雅克-贝拉检验(Jarque-Bera Test,简称JB检验)是一种正态性检验,用于判断一组样本数据是否来自正态分布。该检验由澳大利亚经济学家Carlos Jarque和印度裔统计学家Anil K. Bera于1980年提出,是计量经济学和统计学中应用最为广泛的正态性诊断工具之一。JB检验的核心思想在于

浏览 3 更新 2025-10-26

雅克-贝拉检验 (Jarque-Bera Test)

雅克-贝拉检验(Jarque-Bera Test,简称JB检验)是一种正态性检验,用于判断一组样本数据是否来自正态分布。该检验由澳大利亚经济学家Carlos Jarque和印度裔统计学家Anil K. Bera于1980年提出,是计量经济学统计学中应用最为广泛的正态性诊断工具之一。JB检验的核心思想在于:正态分布的偏度(Skewness)为0、峰度(Kurtosis)为3,若样本的偏度和峰度与这些基准值存在显著偏离,则拒绝正态性假设。

检验的直观逻辑

正态分布是对称的钟形曲线,其两个重要数值特征为偏度和峰度。偏度衡量分布的不对称性:正偏(右偏)意味着右侧尾部更长,负偏(左偏)意味着左侧尾部更长,对称分布的偏度为零。峰度衡量尾部的厚度:正态分布的峰度为3(超值峰度通常报告为超额峰度,即峰度减3),峰度大于3称为"厚尾",小于3称为"薄尾"。

JB检验将样本的偏度和峰度同时纳入考量,构建一个综合统计量。若数据确实来自正态分布,则样本偏度应接近0、样本峰度应接近3,JB统计量应较小。反之,若偏度显著偏离0、峰度显著偏离3,JB统计量将变大,从而有充分证据拒绝正态性假设。

统计原理

样本偏度与样本峰度

x1,x2,,xnx_1, x_2, \ldots, x_n 为独立同分布的样本,样本均值为 xˉ\bar{x}样本偏度(Sample Skewness)定义为:

S=1ni=1n(xixˉ)3[1ni=1n(xixˉ)2]3/2S = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^3}{\left[\frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^2\right]^{3/2}}

样本峰度(Sample Kurtosis)定义为:

K=1ni=1n(xixˉ)4[1ni=1n(xixˉ)2]2K = \frac{\frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^4}{\left[\frac{1}{n}\sum_{i=1}^{n}(x_i - \bar{x})^2\right]^{2}}

对于正态分布,有 E(S)=0E(S) = 0E(K)=3E(K) = 3,且偏度和峰度的渐近方差分别为 6/n6/n24/n24/n

检验统计量

JB检验统计量综合偏度与峰度的偏离程度,其计算公式为:

JB=n(S26+(K3)224)JB = n\left(\frac{S^2}{6} + \frac{(K - 3)^2}{24}\right)

其中 nn 为样本容量。在零假设(数据服从正态分布)下,JB统计量渐近服从自由度为2的卡方分布

JBdχ2(2)JB \xrightarrow{d} \chi^2(2)

统计量中的第一项 S2/6S^2/6 惩罚偏度偏离零的行为,第二项 (K3)2/24(K-3)^2/24 惩罚峰度偏离3的行为。两项均被放大 nn 倍,因此样本量越大,对偏离正态性的敏感度越高。

决策规则

给定显著性水平 α\alpha(通常取0.05),查 χ2(2)\chi^2(2) 分布的临界值 cc。若 JB>cJB > c,则拒绝零假设,认为数据不服从正态分布;否则不拒绝零假设。也可计算p值:若 p<αp < \alpha 则拒绝零假设。

应用与局限性

主要应用场景

JB检验在以下领域有广泛应用:

  • 回归诊断:在普通最小二乘法(OLS)回归中,误差项的正态性是进行精确假设检验和构建置信区间的关键前提。JB检验常用于检验OLS残差的正态性。
  • 金融数据分析金融时间序列(如股票收益率)通常呈现厚尾和非对称特征,JB检验可帮助判断是否偏离正态分布,从而决定是否采用GARCH模型等更贴合的建模方法。
  • 风险管理风险价值(VaR)等指标的准确计算依赖于收益率的分布假定,JB检验为分布假定提供了诊断工具。
  • 质量控制:在统计过程控制中,许多控制图假定过程输出服从正态分布,JB检验可用于验证该假定。

局限性

JB检验并非在所有情形中都表现最优:

  • 小样本偏误:JB检验基于渐近理论,在小样本(n<30n < 30)中检验的第一类错误率可能偏离名义水平,实际拒绝频率可能偏高。Urzúa (1996) 和 Doornik \& Hansen (2008) 提出了适用于小样本的修正版本。
  • 对极端值的敏感性:偏度和峰度对异常值极为敏感,单个极端值可能导致JB统计量大幅膨胀,产生错误的拒绝结论。因此使用前应检查数据中是否存在异常观测。
  • 不是特异性检验:JB检验将偏度和峰度合为一个综合统计量,拒绝正态性后无法直接判断是偏度还是峰度的偏离所致。可分别考察偏度和峰度的显著性作为补充。
  • 对分布形状的局限:JB检验仅针对偏度和峰度这两个矩(第三、四阶矩),无法检测更高阶矩上的偏离正态性。在特殊情形下,某些非正态分布可能恰好具有与正态分布相同的偏度和峰度,导致JB检验失效。

与其他正态性检验的比较

除了JB检验,常用的正态性检验还包括:

  • Shapiro-Wilk检验:基于次序统计量的方差比,在小样本中功效较高,是公认的小样本最优正态性检验之一。但在大样本中计算量较大。
  • Kolmogorov-Smirnov检验:基于经验分布函数与理论分布函数的最大差异,但需要指定分布的均值和方差,且对正态性偏离的敏感度通常低于JB检验和Shapiro-Wilk检验。
  • Anderson-Darling检验:类似于K-S检验,但对尾部差异赋予更大权重,在检测厚尾分布时功效较高。
  • Lilliefors检验:K-S检验的修正版本,适用于均值和方差未知的正态性检验。

一般而言,在中等及以上样本(n30n \geq 30)中,JB检验因其计算简便、无需查特殊临界值表(直接使用χ2(2)\chi^2(2)分布)而受到广泛应用。多数现代统计软件(如StataEViewsR语言Python的scipy.stats模块)均内置了JB检验。

实例说明

假设某数据集包含100个观测值,计算出样本偏度 S=0.45S = 0.45,样本峰度 K=3.82K = 3.82。则:

JB=100×(0.4526+(3.823)224)=100×(0.20256+0.672424)JB = 100 \times \left(\frac{0.45^2}{6} + \frac{(3.82 - 3)^2}{24}\right) = 100 \times \left(\frac{0.2025}{6} + \frac{0.6724}{24}\right)

= 100 \times (0.03375 + 0.02802) = 6.177 查 χ2(2)\chi^2(2) 分布表,5\%显著性水平下的临界值为5.991。由于 6.177>5.9916.177 > 5.991,拒绝正态性假设,认为数据在5\%显著性水平下不服从正态分布。

综上所述,雅克-贝拉检验通过考察样本的偏度和峰度是否与正态分布一致,提供了一个简洁而有效的正态性诊断工具。尽管存在小样本偏误等局限性,其计算简单、直观易解且在大样本中表现良好的特点,使其成为实证分析中不可或缺的正态性检验方法。