ARTICLE

chi-squared statistic

卡方统计量 (Chi-Squared Statistic) 卡方统计量 (Chi-Squared Statistic)，通常记为 ^2，是统计学和计量经济学中使用最广泛的检验统计量之一。它基于观测频数与期望频数之间的差异来衡量数据与理论假设之间的偏离程度。其名称来源于它所服从的卡方分布 (Chi-Squared Distribution)。卡方统计量是假设检

浏览 0 更新 2025-10-26

卡方统计量 (Chi-Squared Statistic)

卡方统计量 (Chi-Squared Statistic)，通常记为 $\chi^2$ ，是统计学和计量经济学中使用最广泛的检验统计量之一。它基于观测频数与期望频数之间的差异来衡量数据与理论假设之间的偏离程度。其名称来源于它所服从的卡方分布 (Chi-Squared Distribution)。卡方统计量是假设检验中非参数推断的基石，广泛应用于拟合优度检验、独立性检验以及回归模型中参数的联合检验。

数学定义

设 $Z_1, Z_2, \ldots, Z_k$ 是 $k$ 个相互独立且服从标准正态分布 $N(0, 1)$ 的随机变量，则它们的平方和定义为一个服从卡方分布、具有 $k$ 个自由度的随机变量：

Q = \sum_{i=1}^{k} Z_i^2 \sim \chi^2(k)

卡方分布的基本性质包括：期望值 $E[\chi^2(k)] = k$ ；方差 $\operatorname{Var}(\chi^2(k)) = 2k$ ；取值范围 $\chi^2 \ge 0$ ；可加性：若 $Q_1 \sim \chi^2(k_1)$ 与 $Q_2 \sim \chi^2(k_2)$ 独立，则 $Q_1 + Q_2 \sim \chi^2(k_1 + k_2)$ 。

卡方统计量的构造

在实际应用中，卡方统计量的通用形式为：

\chi^2 = \sum_{i=1}^{m} \frac{(O_i - E_i)^2}{E_i}

其中 $O_i$ 为观测频数， $E_i$ 为期望频数， $m$ 为类别总数。若零假设为真，观测频数应接近期望频数；除以 $E_i$ 的作用是标准化，使小期望单元格中的偏差获得更大权重。

主要应用

皮尔逊卡方拟合优度检验

用于检验样本数据是否来自某个特定的理论分布。零假设 $H_0$ ：数据服从指定分布；备择假设 $H_1$ ：数据不服从该分布。

\chi^2 = \sum_{i=1}^{m} \frac{(O_i - n p_i)^2}{n p_i}

该统计量在 $H_0$ 下近似服从自由度为 $m - 1 - s$ 的卡方分布，其中 $s$ 是由样本估计的分布参数个数。

卡方独立性检验

用于判断两个分类变量之间是否存在统计关联。数据以列联表 (Contingency Table) 组织。在独立性假设下：

E_{ij} = \frac{R_i \times C_j}{n}

\chi^2 = \sum_{i=1}^{r} \sum_{j=1}^{c} \frac{(O_{ij} - E_{ij})^2}{E_{ij}}

其自由度为 $(r-1)(c-1)$ 。当期望频数过小时，可考虑费舍尔精确检验 (Fisher's Exact Test)。

方差检验

对来自正态总体的样本，可构造：

\chi^2 = \frac{(n-1) s^2}{\sigma_0^2} \sim \chi^2(n-1)

以检验总体方差 $\sigma^2$ 是否等于 $\sigma_0^2$ 。

计量经济学中的联合假设检验

在线性回归模型中，拉格朗日乘数检验 (LM Test)、似然比检验 (LRT) 和沃尔德检验 (Wald Test) 在大样本下均收敛于卡方分布。沃尔德统计量为：

W = (\mathbf{R}\hat{\boldsymbol{\beta}} - \mathbf{r})' \left[ \mathbf{R} \cdot \widehat{\operatorname{Var}}(\hat{\boldsymbol{\beta}}) \cdot \mathbf{R}' \right]^{-1} (\mathbf{R}\hat{\boldsymbol{\beta}} - \mathbf{r}) \xrightarrow{d} \chi^2(q)

与其它分布的关系

卡方与正态分布： $k$ 个独立标准正态随机变量的平方和即为 $\chi^2(k)$ 。
卡方与 t 分布：若 $Z \sim N(0,1)$ 且 $Q \sim \chi^2(k)$ 独立，则 $T = Z/\sqrt{Q/k} \sim t(k)$ 。
卡方与 F 分布：若 $Q_1 \sim \chi^2(k_1)$ 且 $Q_2 \sim \chi^2(k_2)$ 独立，则 $F = \frac{Q_1/k_1}{Q_2/k_2} \sim F(k_1, k_2)$ 。
卡方与伽马分布： $\chi^2(k) \equiv \Gamma(k/2, 2)$ 。

重要性与局限

卡方统计量被广泛使用，因其非参数特性、构造直观，且作为三大渐进检验的共同极限分布构成现代计量经济学假设检验的理论基础。

样本量敏感性：大样本中微不足道的偏离也可能统计显著，需配合效应量 (Effect Size) 指标（如 Cramér's $V$ ）报告。
期望频数约束：期望频数过小时近似不可靠。
独立性假定：在聚类抽样或配对设计中需使用修正版本。
方向性缺失：卡方检验本身是双侧、非定向的。
连续变量离散化的信息损失：在可能时，Kolmogorov-Smirnov 检验或Anderson-Darling 检验可能具有更高的检验功效。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。