ARTICLE

卡方拟合优度检验

卡方拟合优度检验 (Chi-Squared Goodness-of-Fit Test) 卡方拟合优度检验 (Chi-Squared Goodness-of-Fit Test),亦称皮尔逊卡方检验,是推断统计学中用于判断样本观测的分类数据是否服从某一特定理论分布的非参数假设检验方法。由英国统计学家卡尔·皮尔逊于1900年提出,至今仍是生物、社科、金融等领域的基

浏览 1 更新 2025-10-26

卡方拟合优度检验 (Chi-Squared Goodness-of-Fit Test)

卡方拟合优度检验 (Chi-Squared Goodness-of-Fit Test),亦称皮尔逊卡方检验,是推断统计学中用于判断样本观测的分类数据是否服从某一特定理论分布的非参数假设检验方法。由英国统计学家卡尔·皮尔逊于1900年提出,至今仍是生物、社科、金融等领域的基础工具。

核心思想与假设

其逻辑是比较观测频数 Oi O_i 与零假设下的期望频数 Ei E_i :若二者差异足够大,则拒绝零假设。假设结构为:

  • 零假设 H0 H_0 :样本来自某理论分布(如"骰子公平")。
  • 备择假设 H1 H_1 :样本不来自该分布。

检验统计量

统计量衡量各类别中观测与期望的标准化偏差:

χ2=i=1k(OiEi)2Ei\chi^2 = \sum_{i=1}^{k} \frac{(O_i - E_i)^2}{E_i}

其中 k k 为类别数,Oi O_i 为观测频数,Ei=npi E_i = n \cdot p_i 为期望频数(pi p_i 为理论概率)。当 H0 H_0 为真且样本充足时,χ2 \chi^2 近似服从卡方分布自由度 df=k1p df = k - 1 - p p p 为从样本估计的参数个数)。

检验步骤

  1. 陈述假设并设定显著性水平 α \alpha
  2. 将数据分为 k k 个互斥类别,统计 Oi O_i
  3. 计算各类的期望频数 Ei E_i
  4. 代入公式计算 χ2 \chi^2 统计量。
  5. 确定 df df ,查表或计算p值
  6. χ2>χα,df2 \chi^2 > \chi^2_{\alpha, df} p<α p < \alpha ,拒绝 H0 H_0 ;否则无法拒绝。

示例:骰子公平性检验

投掷一枚骰子60次,结果如下:

\medskip \begin{tabular}{|c|c|c|c|c|c|c|} \hline 面 \& 1 \& 2 \& 3 \& 4 \& 5 \& 6 \\ \hline Oi O_i \& 8 \& 13 \& 9 \& 11 \& 10 \& 9 \\ \hline \end{tabular} \medskip

H0 H_0 :各面概率均为 1/6 1/6 ,故 Ei=60×1/6=10 E_i = 60 \times 1/6 = 10

计算得 χ2=(810)210++(910)210=1.6 \chi^2 = \frac{(8-10)^2}{10} + \cdots + \frac{(9-10)^2}{10} = 1.6 。自由度 df=61=5 df = 6-1 = 5 α=0.05 \alpha = 0.05 下临界值 χ0.05,5211.07 \chi^2_{0.05,5} \approx 11.07 。因 1.6<11.07 1.6 < 11.07 ,无法拒绝骰子公平的假设。

使用条件

  • 样本独立性:各观测须相互独立且为随机样本
  • 期望频数:一般要求 Ei5 E_i \geq 5 ;若不足,应合并类别或使用费舍尔精确检验
  • 类别穷尽互斥:每个观测唯一归属一个类别。
  • 大样本近似:小样本下卡方近似的精度下降。

与卡方独立性检验之比较

二者共享相同的统计量形式及渐近分布,但应用场景不同:

  • 拟合优度检验:检验单一分类变量是否服从某理论分布(单变量频率表)。
  • 卡方独立性检验:检验两个分类变量是否相关(列联表)。

经济学与金融学应用

作为从理论假说到实证验证的桥梁,卡方拟合优度检验凭借其直观性和可解释性,与Kolmogorov-Smirnov检验Anderson-Darling检验等新方法一同构成分布检验的工具箱,至今仍是应用最广泛的基础统计工具之一。