ARTICLE

样本量

样本量 (Sample Size) 样本量 (Sample Size)，在统计学和计量经济学中通常用 n 表示，是指在一个研究或实验中从总体 (Population) 中抽取的观测单元或个体的数量。它是研究设计的核心要素，直接影响到研究结果的精确性、可靠性和统计功效。正确确定样本量是实证研究的基石，需要在统计要求与现实约束之间做出权衡。样本量过小可能无法提

浏览 47 更新 2025-10-26

样本量 (Sample Size)

样本量 (Sample Size)，在统计学和计量经济学中通常用 $n$ 表示，是指在一个研究或实验中从总体 (Population) 中抽取的观测单元或个体的数量。它是研究设计的核心要素，直接影响到研究结果的精确性、可靠性和统计功效。正确确定样本量是实证研究的基石，需要在统计要求与现实约束之间做出权衡。

样本量过小可能无法提供足够的统计证据来检测真实存在的效应，导致无法正确拒绝原假设，从而犯Type II Error（第二类错误，即假阴性）。在临床试验中，这意味着一种有效药物可能被错误地判定为无效。反之，样本量过大则会浪费时间、资金和人力，且在涉及人类或动物的实验中可能引发不必要的伦理问题。此外，过大的样本量会使极其微小、毫无实际意义的效应在统计上变得显著，导致研究者得出虽具统计显著性但缺乏实际意义的结论。

样本量的重要性

样本量对研究的影响主要体现在三个重要方面。

第一，估计的精确性：样本量越大，由样本计算出的统计量（如样本均值 $\bar{x}$ 或样本比例 $\hat{p}$ ）就越可能接近真实的总体参数（如总体均值 $\mu$ 或总体比例 $p$ ）。这体现在更窄的置信区间 (Confidence Interval) 和更小的误差范围 (Margin of Error) 上。换言之，增加样本量可以缩小估计的不确定性范围。

第二，统计功效 (Statistical Power)：统计功效是指在一个假设检验中，当备择假设 (Alternative Hypothesis) 为真时，能够正确拒绝原假设 (Null Hypothesis) 的概率，通常表示为 $1-\beta$ ，其中 $\beta$ 是犯第二类错误的概率。更大的样本量通常会带来更高的统计功效，使研究更有可能发现真实存在的效应。通常要求统计功效至少达到 80\%，这意味着研究有 80\% 的概率检测到预设大小的效应。

第三，结果的代表性：虽然样本的代表性主要取决于抽样方法（如简单随机抽样），但足够大的样本量可以减少抽样误差 (Sampling Error) 的影响，使得样本的特征（如均值、方差、分布形态）更接近总体特征，从而增强将研究结论从样本推广到总体的信心。

样本量确定的关键因素

确定一个研究所需的最小样本量，通常需要综合考虑以下四个关键统计指标。该过程被称为先验功效分析 (A Priori Power Analysis)，是在研究开始之前进行的规划步骤。

一、置信水平 (Confidence Level)：即研究者希望其估计结果包含真实总体参数的置信程度。通常设定为 90\%、95\% 或 99\%。95\% 的置信水平意味着如果重复抽样 100 次，大约有 95 次计算出的置信区间会包含真实的总体参数。置信水平越高，所需的样本量就越大。在计算中，置信水平决定了临界值，如正态分布中的 Z-score（ $Z_{\alpha/2}$ ）。对于 95\% 置信水平， $\alpha=0.05$ ，对应的 $Z_{0.025}$ 约为 1.96；对于 99\% 置信水平，对应的 $Z_{0.005}$ 约为 2.58。

二、误差范围 (Margin of Error, $E$ )：也称为可接受的误差或精度。它描述了样本统计量与总体参数之间预计的最大差距。例如，如果希望估计选民支持率的误差在 $\pm 3\%$ 以内，则误差范围 $E=0.03$ 。误差范围要求越小（即精度要求越高），所需的样本量就越大。

三、效应量 (Effect Size)：效应量是衡量一个现象或干预措施强度的标准化指标，表示自变量与因变量之间关系的强度或两组之间差异的大小。例如，在比较两组均值时，Cohen's d 是常用的效应量指标。研究者需预先设定一个期望能检测到的最小效应量。如果希望检测到非常微小的效应，就需要非常大的样本量。效应量的估计可以基于先前研究、试点研究 (Pilot Study) 或该领域的理论知识。

四、数据变异性 (Variability)：指总体中观测值的离散程度，通常用总体标准差 ( $\sigma$ ) 或总体方差 ( $\sigma^2$ ) 来衡量。总体的变异性越大，为了获得精确估计就需要更大的样本量。在实践中，总体标准差通常是未知的，需要通过以往研究或试点研究来估计。

样本量计算公式

根据研究目的的不同，样本量的计算公式也有所差异。

估计总体均值 ( $\mu$ )时：

n = \left( \frac{Z_{\alpha/2} \cdot \sigma}{E} \right)^2

其中 $\sigma$ 是总体标准差的估计值， $E$ 是可接受的最大误差范围。

估计总体比例 ( $p$ )时：

n = \frac{Z_{\alpha/2}^2 \cdot p(1-p)}{E^2}

若对 $p$ 无任何先验信息，通常取 $p=0.5$ ，因为此时 $p(1-p)=0.25$ 达到最大值，给出最保守（最大）的样本量。

两独立样本均值比较（假设检验）时：

n_1 = n_2 = 2 \left( \frac{(Z_{\alpha/2} + Z_{\beta})\sigma}{\mu_1 - \mu_2} \right)^2

其中 $Z_{\beta}$ 取决于预设的统计功效（80\% 功效对应 $Z_{\beta}=0.84$ ，90\% 功效对应 $Z_{\beta}=1.28$ ）， $(\mu_1-\mu_2)$ 是研究者希望检测出的最小均值差异。

实践中的考量与误区

使用上述公式时需注意以下问题。第一，当样本量 $n$ 占总体规模 $N$ 的比例超过 5\% 时，应使用有限总体修正 (Finite Population Correction)： $n' = n/[1+(n-1)/N]$ ，修正后的 $n'$ 总是小于 $n$ 。第二，计算出的样本量是最终分析所需的有效观测数，研究者需预估无应答率或参与者流失率，并相应扩大初始招募数量。第三，警惕"大样本谬误"——极大样本量可使微小而无实际意义的效应在统计上变得显著，因此报告结果时需同时关注效应量和置信区间，而非仅看p-value。第四，所谓"抽取总体的 10\%"是常见误解：对于数百万人口的总体，数千人的随机样本即可提供精确估计——样本量的绝对大小比其相对比例更为关键。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。