ARTICLE

期望频数

期望频数 (Expected Frequency) 期望频数 (Expected Frequency),在统计学中常写作 E ,是一个核心的理论概念。它指的是在某个 统计推断 检验(尤其是在 卡方检验 中)的 零假设 ( H_0 ) 为真的前提下,我们预期在某个分类或单元格中出现的观测对象的频数或计数。理解期望频数对于正确执行和解释统计检验至关重要,因为它构

浏览 50 更新 2025-10-29

期望频数 (Expected Frequency)

期望频数 (Expected Frequency),在统计学中常写作 E E ,是一个核心的理论概念。它指的是在某个 统计推断 检验(尤其是在 卡方检验 中)的 零假设 (H0 H_0 ) 为真的前提下,我们预期在某个分类或单元格中出现的观测对象的频数或计数。理解期望频数对于正确执行和解释统计检验至关重要,因为它构成了判断数据与假设之间偏离程度的基准线。

期望频数是与 观测频数 (Observed Frequency),即在 样本 中实际观察到的频数(写作 O O )相对应的概念。统计检验 的本质,就在于比较观测频数与期望频数的差异:如果两者差异很小,说明样本数据支持零假设;如果差异巨大,则有理由拒绝零假设。这种比较并不是简单目测,而是通过标准化的统计量(如 卡方统计量)来量化偏离程度,从而在概率框架下做出科学决策。

核心概念与用途

期望频数的主要用途是为统计检验提供一个 比较基准,构建一个"无效果"或"无关联"的理论情景。它回答了这样一个反事实问题:如果零假设是真的,数据应该长什么样?

  • 在拟合优度检验中:期望频数代表了如果样本数据完美符合某个预先假设的 概率分布,每个类别应有的频数。例如,检验一枚骰子是否均匀时,期望频数就是每个面出现次数均为总投掷次数的 1/6 1/6
  • 在独立性检验中:期望频数代表了如果两个 分类变量 之间完全独立、互不影响,那么在 列联表 的每个单元格中应有的频数。例如,检验性别与投票倾向是否独立时,期望频数就是按边际比例推算出的每个交叉单元格的理论人数。

通过计算期望频数,可以量化观测数据与零假设所描述的理论情景之间的"距离"或"偏差"。这个偏差是后续统计决策——包括计算 p p 值和判断 统计显著性——的核心输入。没有期望频数作为参照,就无从判断观测到的模式是真实效应还是随机波动所致。

计算期望频数

期望频数的计算方法取决于所进行的具体检验类型,但其核心逻辑都是利用零假设所蕴含的概率结构。

拟合优度检验 (Goodness-of-Fit Test)

拟合优度检验 用于检验一个分类变量的观测频数分布是否与某种理论上的概率分布相符。期望频数的计算公式为:

Ei=n×piE_i = n \times p_i

其中 Ei E_i 为第 i i 个类别的期望频数,n n 为总样本量,pi p_i 为在零假设下第 i i 个类别发生的理论概率。该公式的含义是:在总样本量确定的情况下,将理论概率按比例分配到各个类别中。

示例: 假设糖果公司声称四种颜色糖果比例均等(各 25\%),随机抽取 200 颗得到观测频数如下:

\begin{tabular}{|c|c|} \hline 颜色 \& 观测频数 (O O ) \\ \hline 红色 \& 58 \\ 绿色 \& 45 \\ 黄色 \& 52 \\ 蓝色 \& 45 \\ \hline 总计 \& 200 \\ \hline \end{tabular}

零假设 H0 H_0 :四种颜色的比例均为 0.25。则期望频数为:

E红色=200×0.25=50,E绿色=50,E黄色=50,E蓝色=50E_{\text{红色}} = 200 \times 0.25 = 50,\quad E_{\text{绿色}} = 50,\quad E_{\text{黄色}} = 50,\quad E_{\text{蓝色}} = 50

这些期望频数(均为 50)构成了卡方检验的基准。直观上看,红色(58)略高于预期而绿色(45)略低,但仅凭目测无法判断这种偏离是否在统计上显著——这正是后续卡方检验要解决的问题。

独立性检验 (Test of Independence)

独立性检验 用于判断两个分类变量是否相互独立,数据通常以 列联表 形式呈现。位于第 i i 行和第 j j 列的单元格的期望频数公式为:

Eij=(第 i 行的总计)×(第 j 列的总计)总样本量E_{ij} = \frac{(\text{第 } i \text{ 行的总计}) \times (\text{第 } j \text{ 列的总计})}{\text{总样本量}}

公式的逻辑基础是 概率论 中的独立事件概率公式:若事件 A A B B 独立,则 P(AB)=P(A)×P(B) P(A \cap B) = P(A) \times P(B) 。用行总计除以总样本量估计行概率,列总计除以总样本量估计列概率,两者相乘再乘以总样本量即得期望频数。

示例: 调查 250 位市民的性别与吸烟关系,数据如下:

\begin{tabular}{|c|c|c|c|} \hline \& 吸烟 \& 不吸烟 \& 行总计 \\ \hline 男性 \& 40 \& 60 \& 100 \\ 女性 \& 20 \& 130 \& 150 \\ \hline 列总计 \& 60 \& 190 \& 250 \\ \hline \end{tabular}

零假设 H0 H_0 :性别与吸烟行为相互独立。期望频数为:

E11=100×60250=24,E12=100×190250=76E_{11} = \frac{100 \times 60}{250} = 24,\quad E_{12} = \frac{100 \times 190}{250} = 76
E21=150×60250=36,E22=150×190250=114E_{21} = \frac{150 \times 60}{250} = 36,\quad E_{22} = \frac{150 \times 190}{250} = 114

比较发现,男性吸烟的观测频数(40)远高于期望频数(24),女性吸烟的观测频数(20)低于期望频数(36),这提示性别与吸烟可能存在关联。

在卡方检验中的应用

期望频数是计算 卡方统计量 (χ2 \chi^2 ) 的关键组成部分。卡方统计量衡量了所有类别中观测频数与期望频数的总体差异:

χ2=(OE)2E\chi^2 = \sum \frac{(O - E)^2}{E}

其中 (OE) (O - E) 计算每个类别的偏差,平方后放大较大偏差并消除正负抵消,除以 E E 进行标准化(因为同样的绝对偏差在期望频数较小时更值得关注),最后求和得到总差异度量。计算出的 χ2 \chi^2 值越大,观测数据与零假设的偏离越远,越有理由拒绝零假设。该统计量需与具有特定 自由度卡方分布 临界值比较以做出最终决策。

使用前提与注意事项

卡方检验的有效性依赖于样本量足够大的假设,但这一假设并非直接检验样本量本身,而是通过检查期望频数来验证——因为即使总样本量很大,某些单元格的理论概率也可能极低:

  • 普遍准则:所有单元格的期望频数 E E 均应大于或等于 5,以保证卡方统计量的抽样分布能很好地被 卡方分布 近似。这一准则最早由 Cochran(1954)系统提出。
  • 宽松准则:部分统计学家认为,只要不超过 20\% 的单元格期望频数小于 5,且没有单元格期望频数小于 1,检验结果仍可接受。

期望频数过小的处理方法:

  1. 合并类别:若类别具有逻辑上的顺序或相似性,可合并相邻行或列以增加新类别的期望频数。但需注意合并不应破坏研究问题的实质含义。
  2. 使用精确检验:对于 2×2 2 \times 2 列联表,应使用 费雪精确检验 (Fisher's exact test),它不依赖大样本近似,能给出精确的 p p 值。对于更大表格,也可使用精确检验的扩展形式,或考虑采用 自助法 等计算密集型方法。

总之,期望频数不仅是计算步骤中的一个数值,更是连接观测数据和理论假设的桥梁。它使得研究者能够在统一的概率框架下评估证据的强度,是进行假设检验和得出科学结论的基石。