ARTICLE
Jarque-Bera 检验
%--- %id: 5282 %word: "Jarque-Bera 检验" %created_model: "stub" %verified: true %verified_at: %created_by_id: 1 %view_counts: 0 %inserted_at: "2025-11-07T21:15:06" %updated_at: "2025
%--- %id: 5282 %word: "Jarque-Bera 检验" %created_model: "stub" %verified: true %verified_at: %created_by_id: 1 %view_counts: 0 %inserted_at: "2025-11-07T21:15:06" %updated_at: "2025-11-07T21:15:06" %---
定义与概述
Jarque-Bera 检验(简称 JB 检验)是一种用于判断样本数据是否服从正态分布的统计检验方法。该检验由墨西哥经济学家 Carlos Jarque 和印度经济学家 Anil K. Bera 于 1980 年在计量经济学领域正式提出,属于拉格朗日乘数(LM)检验的一种特殊形式。其核心思想基于正态分布的两个关键数字特征——偏度(Skewness)为零和峰度(Kurtosis)为三。若样本数据来自正态总体,则其偏度应趋近于零,峰度应趋近于三。Jarque-Bera 检验通过构造一个联合检验统计量,同时考察样本偏度与零的差异以及样本峰度与三的差异,来判断数据是否与正态分布存在显著偏离。该检验的提出极大简化了正态性检验的流程,成为计量经济学中最常用的诊断工具之一。
检验统计量
Jarque-Bera 检验的统计量定义为:
其中:
- 为样本容量;
- 为样本偏度(Skewness),衡量概率分布的不对称程度;
- 为样本峰度(Kurtosis),衡量概率分布的尾部厚度和峰部尖锐程度。
偏度 和峰度 的计算公式分别为:
其中 为样本均值, 为样本标准差(通常采用有偏估计量,即除以 而非 )。对于标准正态分布,理论偏度 ,理论峰度 。因此,Jarque-Bera 统计量本质上衡量的是样本偏度与零的偏离程度以及样本峰度与三的偏离程度的加权组合。统计量中的权重系数 和 来源于偏度和峰度样本估计量的渐近方差:偏度样本估计量的渐近方差为 ,峰度样本估计量的渐近方差为 。
检验统计量
Jarque-Bera 检验的统计量定义为:
其中:
- 为样本量;
- 为样本偏度(Skewness),衡量分布的不对称程度;
- 为样本峰度(Kurtosis),衡量分布的尾部厚度。
偏度 和峰度 的计算公式分别为:
其中 为样本均值, 为样本标准差(通常使用有偏估计)。对于正态分布,理论偏度 ,理论峰度 。因此,Jarque-Bera 统计量衡量的是样本偏度与零的偏离程度以及样本峰度与三的偏离程度。
渐近分布与假设检验
在原假设 (数据服从正态分布)成立的条件下,Jarque-Bera 统计量渐近服从自由度为 2 的卡方分布():
这一渐近性质来源于偏度和峰度样本估计量的联合渐近正态性。具体而言,当样本来自正态总体时,样本偏度 和样本峰度 的联合分布渐近趋于均值为 、协方差矩阵为 的二元正态分布,由此推导出 JB 统计量的卡方分布形式。
检验的决策规则为:在给定的显著性水平 下,若计算出的 JB 统计量大于卡方分布在该水平下的临界值 ,则拒绝原假设,认为样本数据不服从正态分布。反之,若 JB 统计量小于临界值,则无法拒绝原假设,即没有充分证据表明数据偏离正态性。常见的显著性水平取 或 ,对应的临界值分别为约 5.99 和 9.21。
应用场景
Jarque-Bera 检验在经济学、金融学和计量经济学领域有着极为广泛的应用。在回归分析中,误差项的正态性假设是许多经典统计推断方法(如 t 检验和 F 检验)得以有效进行的基础条件。研究者通常对回归模型的残差序列进行 Jarque-Bera 检验,以验证模型是否满足经典线性回归模型的正态性假定。若残差显著偏离正态分布,则基于正态假设的区间估计和假设检验结果可能不可靠,此时应考虑使用稳健标准误或采用非参数方法。
在金融领域中,资产收益率的正态性是许多资产定价模型(如资本资产定价模型和 Black-Scholes 期权定价模型)的核心前提假设。大量实证研究表明,金融资产收益率通常呈现尖峰厚尾的特征,即峰度大于三且偏度不为零。Jarque-Bera 检验被广泛应用于检验股票收益率、汇率变动率和利率变化等金融时间序列是否服从正态分布。在风险管理中,VaR(在险价值)和 Expected Shortfall(期望损失)的计算常依赖于收益率分布的正态性假设,因此 Jarque-Bera 检验成为风险建模前期诊断的重要工具。
局限性
尽管 Jarque-Bera 检验在实践中被广泛使用,但它也存在若干不可忽视的局限性。首先,该检验是一种渐近检验,在小样本情况下其检验水平和检验功效可能不理想。对于样本量小于 30 的数据集,JB 统计量可能无法准确逼近卡方分布,导致检验结果不可靠。在此情形下,基于模拟的临界值或 Bootstrap 方法更为适用。其次,Jarque-Bera 检验对异常值较为敏感——个别极端值可能显著改变样本的偏度和峰度估计值,从而导致检验结果产生误导。这意味着数据中的测量误差或录入错误可能直接影响检验结论。第三,该检验仅关注偏度和峰度这两个矩,无法检测正态性在其他更高阶矩方面的偏离,例如分布的多模态特征或双峰分布。因此,如果数据的正态性偏离主要体现为分布形状的复杂变化而非偏度和峰度的改变,JB 检验的检验功效可能较低。
最后,在实际应用中,当样本量非常大时(如超过 2000),Jarque-Bera 检验可能过度敏感。即使数据与正态分布的偏离在数值上微不足道,也会因统计功效过强而轻易拒绝原假设。在大样本情境下,研究者应结合效应量指标(如偏度的绝对值和峰度偏差)与图形诊断工具综合判断数据的正态性偏离是否具有实际意义。因此,研究者通常建议将 Jarque-Bera 检验与其他诊断工具(如 Q-Q 图、直方图、核密度估计图和 Shapiro-Wilk 检验)结合使用,以全面评估数据的正态性特征。
拓展与改进
为克服 Jarque-Bera 检验在小样本下的局限性,学者们提出了一系列改进版本。Urzúa(1996)提出了对自由度进行调整的修正 Jarque-Bera 检验,该检验在小样本下具有更好的有限样本性质,其统计量的渐近分布仍为卡方分布但采用了不同的标准化方式。Doornik 和 Hansen(1994)提出了基于变换的修正检验,通过对偏度和峰度进行适当的数值变换来改善小样本下的检验表现。此外,Bai 和 Ng(2005)将 Jarque-Bera 检验的思想系统性地推广到面板数据的情形,提出了面板 Jarque-Bera 检验,用于检验面板数据中各截面个体的正态性假设,这为宏观经济学和金融面板数据分析提供了重要的诊断手段。
在时间序列分析中,研究者也提出了考虑序列相关性的修正 Jarque-Bera 检验。当数据存在自相关结构时,标准 JB 检验的检验水平可能严重失真,因为自相关会低估样本偏度和峰度的真实变异性。通过采用 Newey-West 类型的异方差自相关一致(HAC)估计量对渐近方差进行调整,可以得到在序列相关下仍然有效的修正 JB 统计量。这些改进版本极大地拓展了 Jarque-Bera 检验的适用范围。
与相关检验的比较
除了 Jarque-Bera 检验之外,统计学中还存在多种正态性检验方法,各有其适用范围和特点。Shapiro-Wilk 检验在小样本下通常比 JB 检验具有更高的检验功效,但其计算较为复杂且对样本量有一定限制。Kolmogorov-Smirnov 检验是一种基于经验分布函数的非参数检验,可直接比较样本分布与理论正态分布之间的差异,但其对分布尾部的差异检测能力较弱。Anderson-Darling 检验是对 Kolmogorov-Smirnov 检验的改进,赋予分布尾部更大的权重,因此在检测尾部偏离时更为敏感。相比而言,Jarque-Bera 检验的计算最为简便,仅需计算样本的前四阶矩,适合作为大规模数据快速诊断的工具。但研究者应注意,没有任何一种正态性检验在所有情境下都是最优的,合理策略是结合多种检验方法和图形诊断工具进行综合判断。
总结
Jarque-Bera 检验是一种基于偏度和峰度的正态性检验方法,因其计算简便、理论基础清晰而在实证研究中得到广泛应用。该检验通过构造一个联合检验统计量,同时考察样本数据的偏度和峰度是否与正态分布的理论值一致。尽管存在小样本偏差、异常值敏感和仅关注低阶矩等局限性,Jarque-Bera 检验仍然是计量经济学和统计学中最常用的正态性诊断工具之一。正确理解和应用 Jarque-Bera 检验,注意其适用条件和局限性,并结合图形诊断与其他检验方法进行综合判断,有助于研究者在数据分析中做出更为可靠和稳健的统计推断。