ARTICLE

离差

离差 (Deviation) 离差是统计学中度量单个观测值与集中趋势之间差异的基础概念,特指数据点与算术平均数之差。它是计算方差、标准差等离散程度指标的起点。 定义与性质 给定数据集 \x_1, x_2, , x_n\,样本均值为 x,任意观测值 x_i 的离差为: 正离差表示高于均值,负离差表示低于均值,零离差等于均值。 离差最核心的性质:所有观测值与均值

浏览 41 更新 2025-10-26

离差 (Deviation)

离差是统计学中度量单个观测值与集中趋势之间差异的基础概念,特指数据点与算术平均数之差。它是计算方差标准差等离散程度指标的起点。

定义与性质

给定数据集 {x1,x2,,xn}\{x_1, x_2, \ldots, x_n\},样本均值为 xˉ\bar{x},任意观测值 xix_i 的离差为:

di=xixˉd_i = x_i - \bar{x}

正离差表示高于均值,负离差表示低于均值,零离差等于均值。

离差最核心的性质:所有观测值与均值的离差之和恒为零

i=1ndi=i=1n(xixˉ)=i=1nxinxˉ=0\sum_{i=1}^{n} d_i = \sum_{i=1}^{n} (x_i - \bar{x}) = \sum_{i=1}^{n} x_i - n\bar{x} = 0

这表明均值是数据集的"平衡点",正负离差相互抵消。正因为此性质,离差本身不能直接作为离散程度的度量,必须通过取绝对值或平方来消除符号问题。

基于离差的关键统计量

  1. 平均绝对离差 (MAD):对各离差取绝对值后求均值,直观但数学上不如平方处理方便。 \[ \text{MAD} = \frac{1}{n}\sum_{i=1}^{n} |x_i - \bar{x}| \]
  2. 方差:将离差平方后求均值,是离散程度最核心的度量。 \begin{itemize}
  3. 总体方差:σ2=1Ni=1N(xiμ)2\sigma^2 = \frac{1}{N}\sum_{i=1}^{N} (x_i - \mu)^2
  4. 样本方差:s2=1n1i=1n(xixˉ)2s^2 = \frac{1}{n-1}\sum_{i=1}^{n} (x_i - \bar{x})^2,分母使用 n1n-1贝塞尔校正,使样本方差成为总体方差的无偏估计。 \end{itemize}
  5. 标准差:方差的平方根,将单位还原为原始数据单位,是实践中最常用的离散度量。 \[ \sigma = \sqrt{\sigma^2}, \quad s = \sqrt{s^2} \]
  6. 最小二乘法线性回归中通过最小化残差(观测点到回归线的垂直离差)的平方和来拟合模型,其核心正是平方离差的最小化,是计量经济学中最重要的参数估计方法。

计算示例

成绩数据 {78,85,92,65,80}\{78, 85, 92, 65, 80\},均值 xˉ=80\bar{x} = 80

离差分别为 2,5,12,15,0-2, 5, 12, -15, 0,之和为零。平方离差为 4,25,144,225,04, 25, 144, 225, 0

样本方差:s2=3984=99.5s^2 = \frac{398}{4} = 99.5

样本标准差:s=99.59.975s = \sqrt{99.5} \approx 9.975

总结

离差本身是一个简单的减法运算,但它是通向数据变异性分析的门户。通过取绝对值(MAD)或平方(方差、标准差),离差衍生出统计学中最重要的离散度量工具,广泛应用于描述性统计假设检验模型拟合等领域。