ARTICLE
正态性检验
正态性检验 (Normality Test) 正态性检验是数理统计学中判断数据是否服从正态分布的假设检验方法。经典参数检验(t检验、方差分析、线性回归分析等)都依赖总体正态性假设,不成立时显著性水平偏离导致第一类错误率失控。 正态性假设的重要性:中心极限定理为正态分布普遍性提供依据;正态分布由均值 和方差 ^2 完全刻画,数学处理便利;正态假设下传统方法具有
正态性检验 (Normality Test)
正态性检验是数理统计学中判断数据是否服从正态分布的假设检验方法。经典参数检验(t检验、方差分析、线性回归分析等)都依赖总体正态性假设,不成立时显著性水平偏离导致第一类错误率失控。
正态性假设的重要性:中心极限定理为正态分布普遍性提供依据;正态分布由均值 和方差 完全刻画,数学处理便利;正态假设下传统方法具有最优统计性质。
图形诊断方法
- 直方图:比对钟形正态密度曲线
- Q-Q图:最强诊断工具,样本分位数 vs 理论分位数配对描点,正态时沿45°直线
- P-P图:经验累积分布 vs 理论累积概率,对尾部敏感性低于Q-Q图
- 箱线图:对称性是正态性的必要但非充分条件
正式统计检验方法
Shapiro-Wilk检验(最稳健有效,小样本到 ):
接近1表明符合正态。对特大样本可能过度敏感。
Kolmogorov-Smirnov检验(Lilliefors修正):基于经验分布函数与理论分布函数的最大垂直距离。Anderson-Darling检验(改进版)对分布尾部赋予更高权重,检测重尾分布时功效更高。
Jarque-Bera检验:基于样本偏度 和峰度 (正态理论偏度0,峰度3):
依赖大样本()。
检验方法比较
\begin{tabular}{|l|l|l|l|l|} \hline 方法 \& 样本量 \& 偏度敏感 \& 峰度敏感 \& 推荐度 \\ \hline Shapiro-Wilk \& \& 高 \& 高 \& ⭐⭐⭐⭐⭐ \\ \hline Anderson-Darling \& 中至大 \& 中 \& 极高 \& ⭐⭐⭐⭐ \\ \hline KS (Lilliefors) \& 中至大 \& 中 \& 低 \& ⭐⭐⭐ \\ \hline Jarque-Bera \& \& 高 \& 高 \& ⭐⭐⭐ \\ \hline \end{tabular}
局限性与决策流程
局限性:大样本轻微偏离也可能拒绝原假设,小样本功效不足;某些检验实际第一类错误率偏离名义水平;多重检验需注意。
决策流程:直方图/Q-Q图初步探索 → Shapiro-Wilk正式检验()→ 结果解读:
正态性检验是连接数据探索与正式统计推断的关键环节,应与图形诊断、稳健性分析、非参数备选方案相结合。