ARTICLE
Jarque-Bera检验
Jarque-Bera 检验 (Jarque-Bera Test) Jarque-Bera 检验 (Jarque-Bera Test,简称 JB 检验) 是一种用于判断样本数据是否服从 正态分布 (Normal Distribution) 的 统计检验 方法。该检验由墨西哥经济学家 Carlos Jarque 和印度统计学家 Anil K. Bera 于19
Jarque-Bera 检验 (Jarque-Bera Test)
Jarque-Bera 检验 (Jarque-Bera Test,简称 JB 检验) 是一种用于判断样本数据是否服从 正态分布 (Normal Distribution) 的 统计检验 方法。该检验由墨西哥经济学家 Carlos Jarque 和印度统计学家 Anil K. Bera 于1980年提出,并于1987年发表了更为完善的版本。JB 检验的核心思想是利用正态分布的两个关键数字特征——偏度 (Skewness) 与 峰度 (Kurtosis)——来度量样本分布与正态分布之间的偏离程度。在 计量经济学 (Econometrics)、金融学 (Finance) 和 数据分析 (Data Analysis) 领域,该检验常被用作 回归分析 后 残差 的正态性诊断工具。
背景与动机
在经典 线性回归模型 (Linear Regression Model) 中,误差项 的 正态性假设 是进行精确 假设检验 和构造 置信区间 的重要前提。当样本量有限时,若误差项严重偏离正态分布,基于 t 检验 和 F 检验 的推断结论可能产生偏误。此外,在 时间序列分析 (Time Series Analysis) 和 风险管理 (Risk Management) 中,许多金融资产的收益率序列呈现出 厚尾 (Heavy Tail) 和 有偏 (Skewed) 特征,这与正态分布的假设相矛盾。Jarque-Bera 检验正是在这一背景下应运而生,为研究者提供了一种简便且有效的正态性检验方法。该检验仅需计算样本偏度和峰度两个统计量,无需对数据进行分组或排序,因而具有较高的计算效率和广泛的适用性。
检验原理
正态分布的概率密度函数完全由 均值 (Mean) 和 方差 (Variance) 两个参数决定,且具有两个重要特性:其一,正态分布的 偏度为零,即分布完全对称;其二,正态分布的 超额峰度为零(峰度值为3),即尾部厚薄适中。偏度衡量的是分布的不对称程度,正偏表示右侧尾部更长,负偏表示左侧尾部更长。峰度则衡量分布的尾部厚度:峰度大于3(即超额峰度大于零)表示分布具有厚尾特征,极端值出现概率更高;峰度小于3则表示薄尾。
Jarque-Bera 检验正是利用这两个特征,通过比较样本偏度和样本峰度与正态分布理论值的差异,来判断数据是否服从正态分布。
检验统计量
Jarque-Bera 检验的统计量定义为:
其中:
- 为 样本量 (Sample Size);
- 为样本偏度 (Sample Skewness),定义为 ,其中 为三阶 中心矩, 为样本标准差;
- 为样本峰度 (Sample Kurtosis),定义为 ,其中 为四阶中心矩。
在 原假设 (数据服从正态分布)成立且样本量足够大的条件下,JB 统计量渐近服从 自由度为2的 卡方分布 (Chi-squared Distribution),即:
自由度为2表明检验涉及两个独立的约束条件:偏度为零和超额峰度为零。
检验步骤
Jarque-Bera 检验的完整流程如下:
- 计算样本矩:根据观测数据计算样本均值 、样本方差 、三阶中心矩 和四阶中心矩 。
- 计算偏度和峰度:利用上述样本矩计算偏度 和峰度 。
- 构建 JB 统计量:代入公式 。
- 确定判决临界值:在给定的 显著性水平 (Significance Level) (通常取 0.05)下,查 卡方分布 表得到临界值 ,或直接计算 p 值 (P-value)。
- 做出推断:若 JB 统计量大于临界值(或 p 值 < ),则拒绝原假设,认为数据不服从正态分布;反之,则不能拒绝原假设。
应用场景
Jarque-Bera 检验在经济学和统计学中有广泛的应用。在 回归分析 中,研究者常在估计 普通最小二乘法 (OLS) 模型后对残差进行 JB 检验,以判断误差项是否满足正态性假设。若残差显著偏离正态分布,则提示可能存在 模型误设 (Model Misspecification)、异常值 (Outliers) 或 异方差性 (Heteroskedasticity) 等问题。在 金融计量学 (Financial Econometrics) 中,JB 检验被用于验证 资产收益率 (Asset Returns) 的正态性——大量实证研究表明,日度或高频收益率序列通常呈现尖峰厚尾特征,JB 检验能够有效地检测出这种偏离。此外,在 投资组合理论 (Portfolio Theory) 中,均值-方差分析 (Mean-Variance Analysis) 隐含地假设收益率服从正态分布,JB 检验为此假设提供了验证工具。在 宏观经济学 (Macroeconomics) 中,JB 检验也被用于检验 通货膨胀率 (Inflation Rate)、GDP 增长率 (GDP Growth Rate) 等宏观经济变量的分布特征,为模型选择提供依据。
局限性
尽管 Jarque-Bera 检验应用广泛,但它也存在若干局限性。第一,JB 检验属于 渐近检验 (Asymptotic Test),在小样本情形下其 检验功效 (Power of Test) 可能不足,实际的 显著性水平 可能偏离名义水平。针对这一问题,统计学家发展了基于 蒙特卡洛模拟 (Monte Carlo Simulation) 的修正版本。第二,JB 检验对 异常值 (Outliers) 极为敏感——少量极端值即可显著改变样本的偏度和峰度估计,导致检验结果失真。第三,该检验无法识别偏离正态分布的具体形式:一个显著的结果可能是由偏度非零、峰度异于3,或者两者共同作用所致。第四,当数据存在 自相关 (Autocorrelation) 时,直接应用 JB 检验可能导致严重的 第一类错误 (Type I Error),因此在使用前需要先对数据进行 白噪声 (White Noise) 检验或采用 Newey-West 估计 进行调整。
替代方法
除 Jarque-Bera 检验外,统计文献中还发展出了多种正态性检验方法。夏皮罗-威尔克检验 (Shapiro-Wilk Test) 在小样本下具有更高的检验功效,但其计算相对复杂且对样本量有上限限制。科尔莫戈罗夫-斯米尔诺夫检验 (Kolmogorov-Smirnov Test) 基于 经验分布函数 (Empirical Distribution Function) 与理论分布的最大差异,但受限于需要预先指定分布的参数。安德森-达林检验 (Anderson-Darling Test) 是对 KS 检验的改进,赋予尾部数据更大的权重,在检测分布尾部偏离时更为灵敏。达戈斯蒂诺检验 (D'Agostino's K-squared Test) 同样基于偏度和峰度,但在统计量的构建方式上与 JB 检验有所不同。总体而言,实践中建议结合 直方图 (Histogram)、Q-Q 图 (Q-Q Plot) 和多种检验方法的结果进行综合判断,而非单一依赖某种检验。