ARTICLE

卡方

卡方 (Chi-squared) 卡方(Chi-squared,记作 ^2)是统计学中最为核心的概念之一,涵盖卡方分布、卡方统计量与卡方检验三个紧密关联的层面。卡方分布由德国大地测量学家Friedrich Robert Helmert于1875年首次推导,后经Karl Pearson于1900年系统发展并引入统计推断,成为现代假设检验的基石之一。 卡方分布

浏览 1 更新 2025-10-26

卡方 (Chi-squared)

卡方(Chi-squared,记作 χ2\chi^2)是统计学中最为核心的概念之一,涵盖卡方分布卡方统计量卡方检验三个紧密关联的层面。卡方分布由德国大地测量学家Friedrich Robert Helmert于1875年首次推导,后经Karl Pearson于1900年系统发展并引入统计推断,成为现代假设检验的基石之一。

卡方分布

卡方分布(Chi-squared distribution)是一种定义在 (0,)(0, \infty) 上的连续概率分布,由独立标准正态随机变量的平方和构造而成。设 Z1,Z2,,ZkZ_1, Z_2, \ldots, Z_k 为独立同分布标准正态随机变量 N(0,1)N(0,1),则:

Q=i=1kZi2χ2(k)Q = \sum_{i=1}^{k} Z_i^2 \sim \chi^2(k)

其中参数 kk 称为自由度(Degrees of Freedom)。卡方分布是Gamma分布的特例,其概率密度函数为:

f(x;k)=12k/2Γ(k/2)xk/21ex/2,x>0f(x; k) = \frac{1}{2^{k/2}\Gamma(k/2)} x^{k/2 - 1} e^{-x/2}, \quad x > 0

卡方分布具有三条关键性质。第一,可加性:若 Q1χ2(k1)Q_1 \sim \chi^2(k_1)Q2χ2(k2)Q_2 \sim \chi^2(k_2) 相互独立,则 Q1+Q2χ2(k1+k2)Q_1 + Q_2 \sim \chi^2(k_1 + k_2)。第二,均值和方差分别为 E[Q]=k\mathbb{E}[Q] = kVar(Q)=2k\text{Var}(Q) = 2k。第三,随着自由度 kk 增大,卡方分布逐渐趋近于正态分布 N(k,2k)N(k, 2k),这是中心极限定理的直接结果。

卡方分布与t分布F分布构成统计推断中三大抽样分布。若 ZN(0,1)Z \sim N(0,1)Qχ2(k)Q \sim \chi^2(k) 独立,则 T=Z/Q/kt(k)T = Z / \sqrt{Q/k} \sim t(k);若 Q1χ2(k1)Q_1 \sim \chi^2(k_1)Q2χ2(k2)Q_2 \sim \chi^2(k_2) 独立,则 F=(Q1/k1)/(Q2/k2)F(k1,k2)F = (Q_1/k_1)/(Q_2/k_2) \sim F(k_1, k_2)

皮尔逊卡方检验

Karl Pearson于1900年提出的皮尔逊卡方检验是统计实践中最常用的方法之一,核心思想是比较观测频数与在原假设下期望的期望频数之间的偏离程度。设共有 nn 个类别,第 ii 类的观测频数为 OiO_i,期望频数为 EiE_i皮尔逊卡方统计量定义为:

χ2=i=1n(OiEi)2Ei\chi^2 = \sum_{i=1}^{n} \frac{(O_i - E_i)^2}{E_i}

该统计量在大样本下近似服从卡方分布,自由度为类别数减去由数据估计的参数个数再减一。当 χ2\chi^2 值过大——即观测与期望的偏离超出随机波动所能解释的范围——则拒绝原假设。

皮尔逊卡方检验有两种主要形式。拟合优度检验检验样本数据是否来自某个特定分布:将数据分组后比较各组频数与理论预期,常用于检验数据是否服从正态分布、泊松分布等。独立性检验用于列联表分析,检验两个分类变量是否相互独立:对于 r×cr \times c 列联表,自由度为 (r1)(c1)(r-1)(c-1),期望频数由行列边际频数乘积除以总样本量计算。

核心应用

卡方方法在计量经济学与社会科学中应用广泛。在异方差检验中,Breusch-Pagan检验White检验的检验统计量均渐近服从卡方分布。在模型选择中,似然比检验统计量 2(lnLulnLr)2(\ln L_u - \ln L_r) 在约束条件成立时渐近服从卡方分布,广泛用于嵌套模型比较。在广义线性模型中,偏差(Deviance)统计量衡量模型拟合优劣,在大样本下近似卡方分布。

使用卡方检验时须注意两个关键假设。其一,各次观测必须独立;其二,期望频数通常不应过小,传统标准要求所有 Ei5E_i \geq 5。当期望频数过小时,卡方近似可能不准确,应改用Fisher精确检验Yates连续性校正。此外,卡方检验仅能判断关联是否存在,本身不衡量关联强度——后者需借助Cramér's VPhi系数等效应量指标。