ARTICLE
样本均值 (Sample Mean)
样本均值 (Sample Mean) 样本均值(Sample Mean)是最基础且最重要的样本统计量之一,记为 x 或 ,用于估计总体均值 。给定一组独立同分布的样本观测值 x_1, x_2, , x_n,样本均值的定义为: 该公式即所有观测值的算术平均。样本均值之所以在统计学中占据核心地位,主要归因于以下三个关键性质:无偏性(Unbiasedness)、一
样本均值 (Sample Mean)
样本均值(Sample Mean)是最基础且最重要的样本统计量之一,记为 或 ,用于估计总体均值 。给定一组独立同分布的样本观测值 ,样本均值的定义为:
该公式即所有观测值的算术平均。样本均值之所以在统计学中占据核心地位,主要归因于以下三个关键性质:无偏性(Unbiasedness)、一致性(Consistency)以及由中心极限定理(Central Limit Theorem)所保证的渐近正态性(Asymptotic Normality)。
定义与计算
设 为来自总体 的随机样本(Random Sample),总体均值为 ,总体方差为 。样本均值定义为各观测值的算术平均:
将具体数值代入即得 ,它是 的点估计(Point Estimate)。例如,某班级 5 名学生的考试成绩为 82、90、75、88、95,则样本均值为 分。
抽样分布与矩
样本均值本身是一个随机变量(Random Variable)——因为抽样之前其值不确定。理解它的分布(即样本均值抽样分布)是统计推断的基石。
- 期望:,这保证了无偏性(Unbiasedness),即大量重复抽样下样本均值的平均值恰好等于总体均值。
- \wiki方差:,表明样本均值的波动幅度随样本量 增大而减小。其平方根 称为标准误(Standard Error, SE)。
- 无偏估计:若总体方差 未知,可用样本方差 估计标准误:。
核心定理
大数定律 (Law of Large Numbers):当 时,样本均值依概率收敛于总体均值:
该定理保证了样本量足够大时,样本均值无限接近真实总体均值。
中心极限定理 (Central Limit Theorem):无论总体分布为何,只要其方差有限,标准化后的样本均值渐近服从标准正态分布:
这为置信区间(Confidence Interval)和假设检验(Hypothesis Testing)提供了理论基础。即使总体不服从正态分布,只要样本量足够大(通常 ),样本均值的分布也近似正态。
应用举例
例:总体均值的置信区间。假设某工厂生产一批电子元件,抽取 件测量其寿命,得 小时, 小时。则总体均值的 95\% 置信区间为:
即我们有 95\% 的信心认为元件真实平均寿命介于 1184.32 至 1215.68 小时之间。
重要性质总结
- 无偏性:
- 一致性:(大数定律)
- 渐近正态性:(中心极限定理)
- 有效性:在独立同分布且方差有限的条件下,样本均值是 的最小方差无偏估计量(UMVUE),即高斯-马尔可夫定理的一个特例。
- 线性性:样本均值是数据的线性函数,分析简便。
与其他概念的联系
样本均值是连接描述统计与推断统计的桥梁。在回归分析中,被解释变量的样本均值在总平方和(SST)的分解中扮演角色;在方差分析(ANOVA)中,各组均值与总均值的比较构成检验的基础;在矩估计法(Method of Moments)中,样本均值是总体均值的一阶矩估计量。此外,自助法(Bootstrap)通过对样本均值反复重抽样来估计其抽样分布,这构成了现代非参数推断的重要工具。