ARTICLE

样本量 (Sample Size)

样本量（Sample Size）是指从总体中抽取的样本所包含的观测单位（individual units）的数量，通常用字母公式表示。它是统计学研究和实验设计中最为关键的参数之一，直接决定了统计推断的精度、可靠性和统计功效（statistical power）。样本量的决定因素确定所需样本量时，需综合考虑以下几个因素：效应量（Effect Size

浏览 0 更新 2025-10-26

样本量（Sample Size）是指从总体中抽取的样本所包含的观测单位（individual units）的数量，通常用字母 $n$ 表示。它是统计学研究和实验设计中最为关键的参数之一，直接决定了统计推断的精度、可靠性和统计功效（statistical power）。

样本量的决定因素

确定所需样本量时，需综合考虑以下几个因素：

效应量（Effect Size）：研究者希望检测到的最小效应量。效应量越小，需要的样本量越大。例如，要检测两组均值之间的小差异，比检测大差异需要更多的样本。

显著性水平（Significance Level, $\alpha$ ）：通常设为 0.05 或 0.01。 $\alpha$ 越小（即对 I 类错误控制越严格），所需样本量越大。

统计功效（Statistical Power, $1-\beta$ ）：通常要求达到 0.80 或 0.90。功效越高（即 $\beta$ 越小，对 II 类错误控制越严格），所需样本量越大。

总体变异度（Population Variability）：总体标准差 $\sigma$ 越大，样本量需求越大。当 $\sigma$ 未知时，可通过预实验或文献估算。

抽样方法：简单随机抽样所需样本量通常小于整群抽样或多阶段抽样，因为后者的设计效应（Design Effect）会降低效率。

样本量计算公式

在简单随机抽样下，估计总体均值 $\mu$ 所需样本量的经典公式为：

n = \frac{Z_{\alpha/2}^2 \cdot \sigma^2}{E^2}

其中 $Z_{\alpha/2}$ 为对应于置信水平 $1-\alpha$ 的标准正态分位数， $\sigma$ 为总体标准差， $E$ 为允许的边际误差（margin of error）。

对于总体比例 $p$ 的估计，公式为：

n = \frac{Z_{\alpha/2}^2 \cdot p(1-p)}{E^2}

当 $p$ 未知时，通常取 $p=0.5$ ，因为此时 $p(1-p)$ 取最大值，能得到最保守（最大）的样本量。

在假设检验中，比较两组均值所需样本量的常用公式为：

n = \frac{2 (Z_{\alpha/2} + Z_{\beta})^2 \sigma^2}{\delta^2}

其中 $\delta$ 为两组均值之差（效应量的分子部分）。

样本量与边际误差的关系

样本量与统计精度之间存在平方根关系：要使边际误差减半，样本量需扩大为原来的四倍。这一关系可以用置信区间（Confidence Interval）的宽度来理解：

\text{ME} = Z_{\alpha/2} \cdot \frac{\sigma}{\sqrt{n}}

这一特性使得样本量增加带来的精度提升呈现边际收益递减（diminishing returns）规律。当样本量较小时，增加样本量的收益非常显著；当样本量已经很大时，继续增加样本量对提升精度的作用日益有限。

实际应用中的考量

在实践中，样本量的确定往往需要在统计精度与成本、时间之间权衡。大样本虽然能提高估计精度，但也会增加数据收集的成本和工作量。此外，还需注意以下几点：

样本代表性（Sample Representativeness）：样本量大并不等同于样本具有代表性。若抽样存在偏差（sampling bias），即使样本量很大，推断结论也可能系统性地偏离总体真实值。

缺失值（Missing Data）：实际研究中常会遇到受访者拒绝回答或数据丢失的情况，因此在计算所需样本量时通常需要上调一定比例（如 10\%–20\%）来弥补预期缺失。

多重比较（Multiple Comparisons）：当同时进行多个假设检验时，需考虑多重比较校正（如 Bonferroni 校正），这也会增加所需的总样本量。

有限总体校正（Finite Population Correction, FPC）：当样本量相对于总体规模较大（通常 $n/N > 0.05$ ）时，应使用有限总体校正因子 $\sqrt{(N-n)/(N-1)}$ 来缩小标准误，从而降低所需样本量。

常见误区

一个普遍的误解是认为样本量越大越好。实际上，过大的样本量可能导致研究者检测到在实践上毫无意义的微小效应（即统计显著但实际不显著的问题）。另一方面，样本量过小则可能导致功效不足，无法检测到真实存在的效应，浪费研究资源。因此，在研究设计阶段进行规范的样本量计算（power analysis）是确保研究质量的关键步骤。

总之，样本量的确定不仅是一个统计技术问题，更需要在研究目的、效应预期、资源约束和推断可靠性之间做出审慎平衡。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。