总体方差 (Population Variance)
总体方差(Population Variance),在概率论和统计学中,是度量总体数据离散度的核心参数。它定义为总体中所有数据点与其总体均值之差的平方的平均值,符号通常表示为 σ2。
数学定义
设有限总体包含 N 个元素 X1,X2,…,XN,均值 μ=∑i=1NXi/N,则总体方差为:
σ2=N∑i=1N(Xi−μ)2
其中 Xi−μ 为偏差,(Xi−μ)2 为平方偏差。平方运算确保所有值为非负,同时放大远离均值的数据点的影响。偏差平方和除以 N 即得平均平方偏差。
对于随机变量 X,方差亦可用期望值定义为:
σ2=Var(X)=E[(X−μ)2]
总体方差与样本方差的区别
\begin{tabular}{|c|c|c|} \hline 特性 \& 总体方差 σ2 \& 样本方差 s2 \\ \hline 数据来源 \& 总体全部数据 N \& 样本数据 n \\ \hline 使用均值 \& 总体均值 μ \& 样本均值 xˉ \\ \hline 公式分母 \& N \& n−1(Bessel's correction) \\ \hline \end{tabular}
样本方差使用 n−1 作为分母,目的是使 s2 成为 σ2 的无偏估计量。由于样本数据点离其自身均值 xˉ 比离总体均值 μ 更近,若除以 n 会系统低估总体方差;通过自由度 n−1 的校正可消除此偏误。
计算示例
某班级5名学生的分数:85, 90, 75, 80, 95。均值 μ=85。平方偏差分别为 0, 25, 100, 25, 100,总和 250。总体方差 σ2=250/5=50,总体标准差 σ=50≈7.07 分。
性质
- 非负性:σ2≥0,当所有数据相同时为 0。
- 常数加法不变性:Var(X+c)=Var(X)。
- 常数乘法变化:Var(cX)=c2Var(X)。
局限
方差的单位是原始数据单位的平方,难以直观解释,故常使用其平方根——总体标准差 σ。此外,方差对异常值敏感,偏差的平方放大了极端值的影响。
相关概念
- 总体标准差:σ=σ2,单位与原始数据相同。
- 协方差:衡量两个变量协同变化的度量。
- 变异系数:CV=σ/∣μ∣,无量纲的相对离散度指标。