ARTICLE
卡方拟合优度检验
卡方拟合优度检验 (Chi-Squared Goodness-of-Fit Test) 卡方拟合优度检验 (Chi-Squared Goodness-of-Fit Test),亦称皮尔逊卡方检验,是推断统计学中用于判断样本观测的分类数据是否服从某一特定理论分布的非参数假设检验方法。由英国统计学家卡尔·皮尔逊于1900年提出,至今仍是生物、社科、金融等领域的基
卡方拟合优度检验 (Chi-Squared Goodness-of-Fit Test)
卡方拟合优度检验 (Chi-Squared Goodness-of-Fit Test),亦称皮尔逊卡方检验,是推断统计学中用于判断样本观测的分类数据是否服从某一特定理论分布的非参数假设检验方法。由英国统计学家卡尔·皮尔逊于1900年提出,至今仍是生物、社科、金融等领域的基础工具。
核心思想与假设
其逻辑是比较观测频数 与零假设下的期望频数 :若二者差异足够大,则拒绝零假设。假设结构为:
- 零假设 :样本来自某理论分布(如"骰子公平")。
- 备择假设 :样本不来自该分布。
检验统计量
统计量衡量各类别中观测与期望的标准化偏差:
其中 为类别数, 为观测频数, 为期望频数( 为理论概率)。当 为真且样本充足时, 近似服从卡方分布,自由度 ( 为从样本估计的参数个数)。
检验步骤
- 陈述假设并设定显著性水平 。
- 将数据分为 个互斥类别,统计 。
- 计算各类的期望频数 。
- 代入公式计算 统计量。
- 确定 ,查表或计算p值。
- 若 或 ,拒绝 ;否则无法拒绝。
示例:骰子公平性检验
投掷一枚骰子60次,结果如下:
\medskip \begin{tabular}{|c|c|c|c|c|c|c|} \hline 面 \& 1 \& 2 \& 3 \& 4 \& 5 \& 6 \\ \hline \& 8 \& 13 \& 9 \& 11 \& 10 \& 9 \\ \hline \end{tabular} \medskip
:各面概率均为 ,故 。
计算得 。自由度 , 下临界值 。因 ,无法拒绝骰子公平的假设。
使用条件
与卡方独立性检验之比较
二者共享相同的统计量形式及渐近分布,但应用场景不同:
- 拟合优度检验:检验单一分类变量是否服从某理论分布(单变量频率表)。
- 卡方独立性检验:检验两个分类变量是否相关(列联表)。
经济学与金融学应用
- 信用风险:评估信用评分卡中预测违约概率与实际违约的校准质量。
- 收入分布:检验收入数据是否符合对数正态分布或帕累托分布。
- 市场微观结构:检验交易到达时间是否服从泊松过程。
- 行为经济学:检验受试者选择是否偏离随机模型的均匀分布。
作为从理论假说到实证验证的桥梁,卡方拟合优度检验凭借其直观性和可解释性,与Kolmogorov-Smirnov检验、Anderson-Darling检验等新方法一同构成分布检验的工具箱,至今仍是应用最广泛的基础统计工具之一。