# 期望频数 (Expected Frequency)
期望频数 (Expected Frequency),在统计学中也常被写作 $E$,是一个核心的理论概念。它指的是在某个{{{统计推断}}}检验(尤其是在{{{卡方检验}}}中)的{{{零假设}}} ($H_0$) 为真的前提下,我们预期在某个分类或单元格中出现的观测对象的频数或计数。
期望频数是与{{{观测频数}}} (Observed Frequency),即在{{{样本}}}中实际观察到的频数(写作 $O$)相对应的概念。{{{统计检验}}}的本质,就在于比较观测频数与期望频数的差异。如果两者差异很小,则说明样本数据支持零假设;如果差异巨大,则我们有理由拒绝零假设。
## 核心概念与用途
期望频数的主要用途是为统计检验提供一个比较基准。它构建了一个“无效果”或“无关联”的理论情景。具体来说:
* 在拟合优度检验中:期望频数代表了如果样本数据完美符合某个预先假设的{{{概率分布}}},每个类别应有的频数。 * 在独立性检验中:期望频数代表了如果两个{{{分类变量}}}之间完全独立、互不影响,那么在{{{列联表}}}的每个单元格中应有的频数。
通过计算期望频数,我们可以量化观测数据与零假设所描述的理论情景之间的“距离”或“偏差”。这个偏差是后续统计决策(如计算p值和判断{{{统计显著性}}})的基础。
## 计算期望频数
期望频数的计算方法取决于所进行的具体检验类型。
### 1. 在拟合优度检验 (Goodness-of-Fit Test) 中
{{{拟合优度检验}}}用于检验一个分类变量的观测频数分布是否与某种理论上的概率分布相符。在这种情况下,期望频数的计算公式为:
$$ E_i = n \times p_i $$
其中: * $E_i$ 是第 $i$ 个类别的期望频数。 * $n$ 是总样本量(所有类别观测频数之和)。 * $p_i$ 是在零假设下,第 $i$ 个类别发生的理论概率。
示例: 假设一家糖果公司声称其生产的混合水果糖中,红色、绿色、黄色、蓝色四种颜色的比例是均等的,即各占25%。为了验证这一说法,我们随机抽取了 200 颗糖果,得到以下观测频数:
| 颜色 | 观测频数 ($O$) | | :--- | :--- | | 红色 | 58 | | 绿色 | 45 | | 黄色 | 52 | | 蓝色 | 45 | | 总计 | 200 |
零假设 $H_0$ 是:四种颜色的比例均为 0.25。 根据公式,我们可以计算每个颜色的期望频数: * $E_{\text{红色}} = 200 \times 0.25 = 50$ * $E_{\text{绿色}} = 200 \times 0.25 = 50$ * $E_{\text{黄色}} = 200 \times 0.25 = 50$ * $E_{\text{蓝色}} = 200 \times 0.25 = 50$
这些期望频数(均为50)构成了我们进行卡方检验的基准。
### 2. 在独立性检验 (Test of Independence) 中
{{{独立性检验}}}用于判断两个分类变量是否相互独立。数据通常以{{{列联表}}} (Contingency Table) 的形式呈现。此时,计算位于第 $i$ 行和第 $j$ 列的单元格的期望频数的公式为:
$$ E_{ij} = \frac{(\text{第 } i \text{ 行的总计}) \times (\text{第 } j \text{ 列的总计})}{\text{总样本量}} $$
这个公式的逻辑基础是{{{概率论}}}中的独立事件概率公式:如果事件 A 和 B 独立,则 $P(A \text{ and } B) = P(A) \times P(B)$。在这里,我们用样本比例来估计概率。
示例: 一项研究调查了250位市民的性别与是否吸烟的关系,以检验性别与吸烟行为是否独立。观测数据如下:
| | 吸烟 | 不吸烟 | 行总计 | | :--- | :---: | :---: | :---: | | 男性 | 40 | 60 | 100 | | 女性 | 20 | 130 | 150 | | 列总计| 60 | 190 | 250 |
零假设 $H_0$ 是:性别与吸烟行为相互独立。 我们来计算每个单元格的期望频数: * 男性且吸烟的期望频数 $E_{11}$: $$ E_{11} = \frac{(\text{男性行总计}) \times (\text{吸烟列总计})}{\text{总样本量}} = \frac{100 \times 60}{250} = 24 $$ * 男性且不吸烟的期望频数 $E_{12}$: $$ E_{12} = \frac{100 \times 190}{250} = 76 $$ * 女性且吸烟的期望频数 $E_{21}$: $$ E_{21} = \frac{150 \times 60}{250} = 36 $$ * 女性且不吸烟的期望频数 $E_{22}$: $$ E_{22} = \frac{150 \times 190}{250} = 114 $$
这些期望频数描绘了在性别与吸烟完全无关的情况下,我们理论上应该看到的频数分布。
## 在卡方检验中的应用
期望频数是计算{{{卡方统计量}}} ($\chi^2$) 的关键组成部分。卡方统计量衡量了所有类别中观测频数与期望频数的总体差异。其公式为:
$$ \chi^2 = \sum \frac{(O - E)^2}{E} $$
* $(O - E)$ 计算了每个类别的偏差。 * $(O - E)^2$ 将偏差平方,使其变为正值,并放大了较大的偏差。 * $\frac{(O - E)^2}{E}$ 对偏差进行了标准化,使得一个绝对偏差的大小需要相对于其期望频数来评估。 * $\sum$ 将所有类别的标准化平方偏差加总,得到一个总的差异度量。
计算出的 $\chi^2$ 值越大,表明观测数据与零假设的理论预期偏离得越远,我们就越有理由拒绝零假设。计算出的统计量需要与具有特定{{{自由度}}}的{{{卡方分布}}}的临界值进行比较,以做出最终的统计决策。
## 使用前提与注意事项
卡方检验的有效性依赖于一个重要假设:样本量足够大。这个假设通常通过检查期望频数来验证。
* 普遍准则:为了保证卡方统计量的抽样分布能够很好地被{{{卡方分布}}}所近似,所有单元格的期望频数 $E$ 都应大于或等于5。 * 宽松准则:有些统计学家认为,只要不超过20%的单元格期望频数小于5,并且没有单元格的期望频数小于1,检验结果仍然是可接受的。
如果期望频数过小,该怎么办? 1. 合并类别:如果变量的类别具有逻辑上的顺序或相似性,可以考虑将相邻的行或列进行合并,以增加新类别的期望频数。 2. 使用精确检验:对于2x2的列联表,当期望频数过小时,应使用{{{费雪精确检验}}} (Fisher's exact test),因为它不依赖于大样本近似,能够给出精确的p值。对于更大的表格,也可以使用精确检验的扩展形式。
总之,期望频数不仅是计算步骤中的一个数值,更是连接观测数据和理论假设的桥梁,是进行假设检验和得出科学结论的基石。