ARTICLE

总体方差

总体方差 (Population Variance) 总体方差(Population Variance),在概率论和统计学中,是度量总体数据离散度的核心参数。它定义为总体中所有数据点与其总体均值之差的平方的平均值,符号通常表示为 ^2。 数学定义 设有限总体包含 N 个元素 X_1, X_2, , X_N,均值 = _i=1^N X_i / N,则总体方差为

浏览 62 更新 2025-10-26

总体方差 (Population Variance)

总体方差(Population Variance),在概率论统计学中,是度量总体数据离散度的核心参数。它定义为总体中所有数据点与其总体均值之差的平方的平均值,符号通常表示为 σ2\sigma^2

数学定义

设有限总体包含 NN 个元素 X1,X2,,XNX_1, X_2, \ldots, X_N,均值 μ=i=1NXi/N\mu = \sum_{i=1}^{N} X_i / N,则总体方差为:

σ2=i=1N(Xiμ)2N\sigma^2 = \frac{\sum_{i=1}^{N} (X_i - \mu)^2}{N}

其中 XiμX_i - \mu 为偏差,(Xiμ)2(X_i - \mu)^2 为平方偏差。平方运算确保所有值为非负,同时放大远离均值的数据点的影响。偏差平方和除以 NN 即得平均平方偏差。

对于随机变量 XX,方差亦可用期望值定义为:

σ2=Var(X)=E[(Xμ)2]\sigma^2 = \text{Var}(X) = E[(X - \mu)^2]

总体方差与样本方差的区别

\begin{tabular}{|c|c|c|} \hline 特性 \& 总体方差 σ2\sigma^2 \& 样本方差 s2s^2 \\ \hline 数据来源 \& 总体全部数据 NN \& 样本数据 nn \\ \hline 使用均值 \& 总体均值 μ\mu \& 样本均值 xˉ\bar{x} \\ \hline 公式分母 \& NN \& n1n-1Bessel's correction) \\ \hline \end{tabular}

样本方差使用 n1n-1 作为分母,目的是使 s2s^2 成为 σ2\sigma^2无偏估计量。由于样本数据点离其自身均值 xˉ\bar{x} 比离总体均值 μ\mu 更近,若除以 nn 会系统低估总体方差;通过自由度 n1n-1 的校正可消除此偏误。

计算示例

某班级5名学生的分数:85, 90, 75, 80, 95。均值 μ=85\mu = 85。平方偏差分别为 0, 25, 100, 25, 100,总和 250。总体方差 σ2=250/5=50\sigma^2 = 250 / 5 = 50,总体标准差 σ=507.07\sigma = \sqrt{50} \approx 7.07 分。

性质

  1. 非负性σ20\sigma^2 \ge 0,当所有数据相同时为 0。
  2. 常数加法不变性Var(X+c)=Var(X)\text{Var}(X + c) = \text{Var}(X)
  3. 常数乘法变化Var(cX)=c2Var(X)\text{Var}(cX) = c^2 \text{Var}(X)

局限

方差的单位是原始数据单位的平方,难以直观解释,故常使用其平方根——总体标准差 σ\sigma。此外,方差对异常值敏感,偏差的平方放大了极端值的影响。

相关概念

  • 总体标准差σ=σ2\sigma = \sqrt{\sigma^2},单位与原始数据相同。
  • 协方差:衡量两个变量协同变化的度量。
  • 变异系数CV=σ/μCV = \sigma / |\mu|,无量纲的相对离散度指标。