ARTICLE

样本标准差 (Sample Standard Deviation)

样本标准差 (Sample Standard Deviation) 样本标准差 (Sample Standard Deviation) 是统计学中最常用的离散程度度量之一。它描述了一组样本数据在其样本均值周围的散布程度，是总体标准差的样本估计量。通常记作 s 或。定义与公式设从某个总体中抽取了一个随机样本 X_1, X_2, , X_n ，样本均值为

浏览 0 更新 2025-10-26

样本标准差 (Sample Standard Deviation)

样本标准差 (Sample Standard Deviation) 是统计学中最常用的离散程度度量之一。它描述了一组样本数据在其样本均值周围的散布程度，是总体标准差 $\sigma$ 的样本估计量。通常记作 $s$ 或 $\hat{\sigma}$ 。

定义与公式

设从某个总体中抽取了一个随机样本 $X_1, X_2, \ldots, X_n$ ，样本均值为 $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$ 。则样本标准差定义为：

s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2}

其平方即为 样本方差：

s^2 = \frac{1}{n-1} \sum_{i=1}^n (X_i - \bar{X})^2

样本标准差与样本方差共享同一个结构核心——离差平方和 (Sum of Squared Deviations, SSD) $\sum (X_i - \bar{X})^2$ ，区别仅在于标准差在最后多取了一次平方根。由于量纲与原始数据一致，样本标准差在描述性统计和实际解读中远比方差直观：若数据以"元"为单位，标准差的单位也是"元"，而方差的单位是"元²"。

分母 $n-1$ ：贝塞尔校正

公式中使用 $n-1$ 而非 $n$ 作为分母，被称为 贝塞尔校正 (Bessel's Correction)。其目的并非使样本标准差本身无偏，而是保证 样本方差 $s^2$ 是总体方差 $\sigma^2$ 的无偏估计量。直觉上，样本均值 $\bar{X}$ 本身也是从样本中估计出来的，它天然比未知的总体均值 $\mu$ 更"贴近"样本数据点，因此 $\sum (X_i - \bar{X})^2$ 会系统性地偏小于 $\sum (X_i - \mu)^2$ 。除以 $n-1$ 而非 $n$ 正是对这一系统性偏小的补偿。

$n-1$ 在统计学术语中被称为 自由度 (Degrees of Freedom)： $n$ 个离差 $(X_i - \bar{X})$ 受一个约束条件 $\sum (X_i - \bar{X}) = 0$ 的限制，因此只有 $n-1$ 个离差可以自由变化。

一个关键事实：样本标准差本身是有偏的

一个容易产生的误解是：既然 $s^2$ 是 $\sigma^2$ 的无偏估计量，那么对 $s^2$ 开平方得到的 $s$ 似乎也应该是 $\sigma$ 的无偏估计量。实际上，样本标准差 $s$ 通常不是总体标准差 $\sigma$ 的无偏估计量。

这个结论源于 Jensen 不等式。平方根函数 $f(x) = \sqrt{x}$ 是严格凹函数，根据 Jensen 不等式：

E[s] = E[\sqrt{s^2}] < \sqrt{E[s^2]} = \sqrt{\sigma^2} = \sigma

因此 $E[s] < \sigma$ ，即样本标准差在期望上会系统性地低估总体标准差。这是一种 向下偏误。偏误的大小随样本容量 $n$ 的增大而减小。在正态总体假设下，存在一个依赖于 $n$ 的校正因子 $c_4(n)$ 使得 $s / c_4(n)$ 成为 $\sigma$ 的无偏估计量，但在绝大多数应用场景中，这一偏误很小且可被接受，研究者直接使用有轻微偏误的 $s$ 并不影响结论的有效性。

与总体标准差的关系

理解样本标准差与总体标准差的关系，是统计推断的关键。总体标准差 $\sigma$ 的定义基于总体均值 $\mu$ ：

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (X_i - \mu)^2}

其中 $N$ 是总体大小。二者的根本区别在于：

分母不同： 样本标准差使用 $n-1$ （贝塞尔校正），总体标准差使用 $N$ 。
中心不同： 样本标准差以 $\bar{X}$ 为中心，总体标准差以 $\mu$ 为中心。 $\bar{X}$ 是从同一批数据估计的，因此离差平方和天然偏小。
目的不同： $\sigma$ 是客观的总体特征（参数）， $s$ 是对 $\sigma$ 的估计（统计量），二者是参数与估计量的关系。

当样本量 $n$ 很大时， $n-1 \approx n$ 且 $\bar{X} \approx \mu$ ，因此 $s \approx \sigma$ ，这也是大样本理论中样本标准差表现良好的原因。

大样本性质：一致性

尽管在小样本中存在轻微偏误，样本标准差具备 一致性 (Consistency)：当样本容量 $n \to \infty$ 时， $s$ 依概率收敛于 $\sigma$ 。这一性质的直观理解是：随着样本量增大， $\bar{X}$ 越来越接近 $\mu$ ，贝塞尔校正因子 $(n-1)/n$ 趋于 1，两个核心误差源同时消失。一致性保证了大样本下 $s$ 可以任意接近 $\sigma$ ，是大样本统计推断的重要理论基础。

核心应用

$t$ 检验与 $t$ 置信区间

在总体标准差 $\sigma$ 未知的现实情境中，样本标准差是构造 t 统计量 和 置信区间 的基础：

t = \frac{\bar{X} - \mu_0}{s / \sqrt{n}}

其中分母 $s / \sqrt{n}$ 即为标准误 (Standard Error of the Mean)。由于使用了估计量 $s$ 替代未知的 $\sigma$ ， $t$ 统计量服从自由度为 $n-1$ 的t 分布而非正态分布。这是 单样本 t 检验 和 双样本 t 检验 的理论核心。

效应量：Cohen's $d$

样本标准差是计算标准化效应量的关键组件。Cohen's d 将两组均值差异除以合并样本标准差，得到一个不受原始测量单位影响的标准化差异度量。

异常值检测与数据探索

样本标准差常用于构造"均值 $\pm k$ 倍标准差"区间来识别潜在异常值，也在标准化 (Standardization, $z$ -score) 中充当分母：

z_i = \frac{X_i - \bar{X}}{s}

样本标准差与标准误的区分

这是初学者最容易混淆的一对概念：

\begin{tabular}{|l|l|l|} \hline 概念 \& 样本标准差 $s$ \& 标准误 $s / \sqrt{n}$ \\ \hline 描述对象 \& 单个观测值的离散程度 \& 样本均值的估计精度 \\ \hline 随 $n$ 增大 \& 趋于 $\sigma$ （稳定） \& 趋于 $0$ （越来越精确） \\ \hline 用途 \& 描述数据分布 \& 构造置信区间、假设检验 \\ \hline \end{tabular}

核心直觉： 样本标准差回答"数据点彼此之间差多少"，标准误回答"样本均值作为 $\mu$ 的估计量，其误差大概有多大"。

与其他离散度量指标的比较

除了样本标准差，描述数据离散程度的常用指标还包括：

极差 (Range)：最大值与最小值之差，计算简单但极不稳定，对异常值高度敏感。
四分位距 (Interquartile Range, IQR)：第三四分位数与第一四分位数之差，对异常值稳健，但不利用全部数据信息。
平均绝对偏差 (Mean Absolute Deviation, MAD)：各观测值与均值绝对离差的平均值，量纲与数据一致，但在数学上不如标准差便于推导（绝对值函数不可导）。

相比之下，样本标准差因平方处理对极端值更敏感，但其良好的数学性质（可微性、与正态分布的天然联系、方差的可加性）使其成为推断统计的首选离散度量。在实际研究中，通常同时报告均值和标准差，或中位数和四分位距，后者在数据严重偏态时更为稳健。

总结

样本标准差是连接描述统计与推断统计的桥梁。它以与原始数据相同的量纲刻画了数据的变异性，是 $t$ 检验、置信区间、效应量等一系列统计推断工具的基石。理解其分母 $n-1$ 的来源、其自身的有偏性、以及与标准误的区分，是掌握推断统计的关键一步。同时，它并非唯一的离散度量：极差、四分位距、平均绝对偏差各有适用场景，研究者应根据数据特征和分析目的选择恰当的指标。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。

样本标准差 (Sample Standard Deviation)