ARTICLE
离差
离差 (Deviation) 离差是统计学中度量单个观测值与集中趋势之间差异的基础概念,特指数据点与算术平均数之差。它是计算方差、标准差等离散程度指标的起点。 定义与性质 给定数据集 \x_1, x_2, , x_n\,样本均值为 x,任意观测值 x_i 的离差为: 正离差表示高于均值,负离差表示低于均值,零离差等于均值。 离差最核心的性质:所有观测值与均值
浏览 41
更新 2025-10-26
离差 (Deviation)
离差是统计学中度量单个观测值与集中趋势之间差异的基础概念,特指数据点与算术平均数之差。它是计算方差、标准差等离散程度指标的起点。
定义与性质
给定数据集 ,样本均值为 ,任意观测值 的离差为:
正离差表示高于均值,负离差表示低于均值,零离差等于均值。
离差最核心的性质:所有观测值与均值的离差之和恒为零:
这表明均值是数据集的"平衡点",正负离差相互抵消。正因为此性质,离差本身不能直接作为离散程度的度量,必须通过取绝对值或平方来消除符号问题。
基于离差的关键统计量
- 平均绝对离差 (MAD):对各离差取绝对值后求均值,直观但数学上不如平方处理方便。 \[ \text{MAD} = \frac{1}{n}\sum_{i=1}^{n} |x_i - \bar{x}| \]
- 方差:将离差平方后求均值,是离散程度最核心的度量。 \begin{itemize}
- 总体方差:
- 样本方差:,分母使用 是贝塞尔校正,使样本方差成为总体方差的无偏估计。 \end{itemize}
- 标准差:方差的平方根,将单位还原为原始数据单位,是实践中最常用的离散度量。 \[ \sigma = \sqrt{\sigma^2}, \quad s = \sqrt{s^2} \]
- 最小二乘法:线性回归中通过最小化残差(观测点到回归线的垂直离差)的平方和来拟合模型,其核心正是平方离差的最小化,是计量经济学中最重要的参数估计方法。
计算示例
成绩数据 ,均值 :
离差分别为 ,之和为零。平方离差为 。
样本方差:
样本标准差:
总结
离差本身是一个简单的减法运算,但它是通向数据变异性分析的门户。通过取绝对值(MAD)或平方(方差、标准差),离差衍生出统计学中最重要的离散度量工具,广泛应用于描述性统计、假设检验和模型拟合等领域。