知经 KNOWECON · 卓越的经济金融统计数学学习平台

正态总体均值的置信区间

# 正态总体均值的置信区间 (Confidence Interval for the Mean of a Normal Population)

正态总体均值的置信区间是{{{统计推断}}}中的一个核心工具,它为未知的{{{总体}}}均值 $\mu$ 提供了一个基于{{{样本}}}数据的{{{区间估计}}}。与给出一个单一数值的{{{点估计}}}(如样本均值 $\bar{x}$)不同,置信区间提供了一个数值范围,我们有特定的{{{置信水平}}}相信这个范围包含了真实的总体均值。

构建此置信区间的基本前提是,我们从一个服从{{{正态分布}}} $N(\mu, \sigma^2)$ 的总体中抽取一个随机样本。这里的 $\mu$ 是我们希望估计的未知总体均值,而 $\sigma^2$ 是总体方差。构建置信区间的方法取决于总体方差 $\sigma^2$ 是否已知。

## 场景一:总体方差 $\sigma^2$ 已知

这是一个在理论教学中常见但在实际应用中较少见的情况,因为它假设我们预先知道了总体的变异程度。

### 理论基础

根据中心极限定理的推论,如果从一个正态总体 $N(\mu, \sigma^2)$ 中抽取容量为 $n$ 的随机样本 $X_1, X_2, \ldots, X_n$,那么样本均值 $\bar{X}$ 的{{{抽样分布}}}也服从正态分布: $$ \bar{X} \sim N\left(\mu, \frac{\sigma^2}{n}\right) $$ 其中,分布的均值是总体均值 $\mu$,方差是总体方差的 $1/n$。这个分布的{{{标准差}}},即 $\sigma/\sqrt{n}$,被称为{{{均值的标准误}}} (Standard Error of the Mean)

为了构建置信区间,我们将样本均值 $\bar{X}$ 进行{{{标准化}}},得到一个服从{{{标准正态分布}}} $N(0, 1)$ 的量,通常记为 $Z$: $$ Z = \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} \sim N(0, 1) $$

### 置信区间的推导

我们的目标是找到一个以样本均值 $\bar{X}$ 为中心的区间,该区间有 $1-\alpha$ 的概率包含未知的总体均值 $\mu$。这里的 $1-\alpha$ 是置信水平(例如,95%),而 $\alpha$ 是{{{显著性水平}}}。

1. 我们从标准正态分布中找到两个{{{临界值}}} (critical values) $\pm z_{\alpha/2}$,使得这两个值之间的面积为 $1-\alpha$。 $$ P(-z_{\alpha/2} < Z < z_{\alpha/2}) = 1 - \alpha $$ 其中 $z_{\alpha/2}$ 是标准正态分布上侧 $\alpha/2$ 分位数,即其右侧尾部面积为 $\alpha/2$ 的点。

2. 将 $Z$ 的表达式代入上述不等式: $$ P\left(-z_{\alpha/2} < \frac{\bar{X} - \mu}{\sigma / \sqrt{n}} < z_{\alpha/2}\right) = 1 - \alpha $$

3. 对不等式进行代数变换,以使 $\mu$ 处于中间位置: $$ P\left(\bar{X} - z_{\alpha/2} \frac{\sigma}{\sqrt{n}} < \mu < \bar{X} + z_{\alpha/2} \frac{\sigma}{\sqrt{n}}\right) = 1 - \alpha $$

### 公式

基于上述推导,当总体方差 $\sigma^2$ 已知时,总体均值 $\mu$ 的 $100(1-\alpha)\%$ 置信区间的计算公式为: $$ \left( \bar{x} - z_{\alpha/2} \frac{\sigma}{\sqrt{n}}, \quad \bar{x} + z_{\alpha/2} \frac{\sigma}{\sqrt{n}} \right) $$ 或者可以写成: $$ \bar{x} \pm z_{\alpha/2} \frac{\sigma}{\sqrt{n}} $$ 这里的 $\bar{x}$ 是从具体样本中计算出的样本均值。公式中的 $z_{\alpha/2} \frac{\sigma}{\sqrt{n}}$ 部分被称为{{{边际误差}}} (Margin of Error),它决定了置信区间的宽度。

* 对于95%的置信水平,$\alpha = 0.05$,$\alpha/2 = 0.025$,对应的 $z_{0.025} \approx 1.96$。 * 对于99%的置信水平,$\alpha = 0.01$,$\alpha/2 = 0.005$,对应的 $z_{0.005} \approx 2.576$。

注意:根据{{{中心极限定理}}} (Central Limit Theorem),如果总体分布未知,但样本量 $n$ 足够大(通常认为 $n \ge 30$),$\bar{X}$ 的抽样分布也近似服从正态分布,因此上述公式仍然适用(此时 $\sigma$ 若未知,可用样本标准差 $s$ 近似替代,但更严谨的做法是使用下面的t-分布)。

## 场景二:总体方差 $\sigma^2$ 未知

这是在实际研究和分析中绝大多数情况下的场景。由于总体方差 $\sigma^2$ 未知,我们必须使用样本数据来估计它。这个估计量就是{{{样本方差}}} $s^2$

### 理论基础

当我们用样本标准差 $s$ 替代未知的总体标准差 $\sigma$ 时,之前构造的标准化统计量不再服从标准正态分布。相反,它服从一个具有 $n-1$ 个{{{自由度}}} (degrees of freedom) 的{{{t-分布}}} (t-distribution)。这个统计量记为 $T$: $$ T = \frac{\bar{X} - \mu}{S / \sqrt{n}} \sim t(n-1) $$ 其中 $S$ 是样本标准差的随机变量形式。t-分布由William Sealy Gosset(笔名 "Student")发现,因此也常被称为 "学生t-分布"。它与标准正态分布相似,都是钟形、对称于0,但t-分布的尾部更“厚”,意味着它有更大的变异性。这种更大的变异性来自于使用样本标准差 $s$ 替代总体标准差 $\sigma$ 所引入的额外不确定性。随着自由度(即样本量 $n$)的增加,t-分布逐渐逼近标准正态分布。

### 置信区间的推导

推导过程与方差已知时非常相似,但使用的是t-分布的临界值 $t_{\alpha/2, n-1}$:

1. 从自由度为 $n-1$ 的t-分布中找到临界值 $\pm t_{\alpha/2, n-1}$,使得其间的面积为 $1-\alpha$。 $$ P(-t_{\alpha/2, n-1} < T < t_{\alpha/2, n-1}) = 1 - \alpha $$

2. 将 $T$ 的表达式代入: $$ P\left(-t_{\alpha/2, n-1} < \frac{\bar{X} - \mu}{S / \sqrt{n}} < t_{\alpha/2, n-1}\right) = 1 - \alpha $$

3. 整理不等式,分离出 $\mu$: $$ P\left(\bar{X} - t_{\alpha/2, n-1} \frac{S}{\sqrt{n}} < \mu < \bar{X} + t_{\alpha/2, n-1} \frac{S}{\sqrt{n}}\right) = 1-\alpha $$

### 公式

当总体方差 $\sigma^2$ 未知时,总体均值 $\mu$ 的 $100(1-\alpha)\%$ 置信区间的计算公式为: $$ \left( \bar{x} - t_{\alpha/2, n-1} \frac{s}{\sqrt{n}}, \quad \bar{x} + t_{\alpha/2, n-1} \frac{s}{\sqrt{n}} \right) $$ 或者可以写成: $$ \bar{x} \pm t_{\alpha/2, n-1} \frac{s}{\sqrt{n}} $$ 这里的 $\bar{x}$ 和 $s$ 分别是从样本中计算出的样本均值和样本标准差。临界值 $t_{\alpha/2, n-1}$ 需要根据给定的置信水平 $\alpha$ 和样本量 $n$ 从t-分布表中查得或使用软件计算。

## 置信区间的正确理解

对置信区间的解释至关重要,也是初学者常见的误区。

* 正确的解释:一个95%的置信区间意味着,如果我们重复进行抽样和计算置信区间的过程无数次,那么由这个方法所构造出的所有区间中,大约有95%的区间会包含真实的、未知的总体均值 $\mu$。这里的 "95%" 指的是方法的可靠性或成功率,而不是某个特定区间的属性。

* 错误的解释:一旦你根据一组具体的样本数据计算出一个置信区间(例如,[10.2, 11.8]),不能说“总体均值 $\mu$ 有95%的概率落在这个区间内”。因为真实的 $\mu$ 是一个固定的常数(尽管未知),而你计算出的区间也是一个固定的区间。$\mu$ 要么在这个区间内,要么不在,不存在概率问题。概率性体现在构造这一区间的“过程”上。

## 影响置信区间宽度的因素

置信区间的宽度等于 $2 \times (\text{边际误差})$。它受到以下三个主要因素的影响:

1. 置信水平 ($1-\alpha$):置信水平越高,区间越宽。例如,99%的置信区间会比95%的置信区间宽。这是因为要以更高的信心捕捉到总体均值,你需要一个更大的“网”(范围)。数学上,更高的置信水平意味着更小的 $\alpha$,从而导致更大的临界值($z_{\alpha/2}$ 或 $t_{\alpha/2, n-1}$)。

2. 样本量 ($n$):样本量越大,区间越窄。随着样本量的增加,均值的标准误 $s/\sqrt{n}$ 会减小,这意味着我们的估计更加精确。更多的信息导致更少的不确定性。

3. 数据变异性 ($s$ 或 $\sigma$):样本(或总体)的标准差越大,区间越宽。当数据本身非常分散时,对总体均值的估计就带有更大的不确定性,因此需要一个更宽的区间来维持给定的置信水平。