ARTICLE
随机抽样
随机抽样 (Random Sampling) 随机抽样(概率抽样)是统计学和研究方法的基本技术:总体中每个体有已知非零概率被抽中。目标是获得代表性样本以进行推断并量化抽样误差。最大限度减少抽样偏误(尤其是选择偏误)。与非随机抽样(便利抽样、判断抽样)相对,后者因主观选择而代表性无法保证。 核心原则 无偏性:随机化排除主观偏好干扰,样本统计量(如样本均值 x)
浏览 52
更新 2025-10-26
随机抽样 (Random Sampling)
随机抽样(概率抽样)是统计学和研究方法的基本技术:总体中每个体有已知非零概率被抽中。目标是获得代表性样本以进行推断并量化抽样误差。最大限度减少抽样偏误(尤其是选择偏误)。与非随机抽样(便利抽样、判断抽样)相对,后者因主观选择而代表性无法保证。
核心原则
- 无偏性:随机化排除主观偏好干扰,样本统计量(如样本均值 )的期望值等于总体参数(如总体均值 )
- 代表性:从概率上看是在关键特征上与总体结构相似的最佳方法
- 可量化的误差:可计算置信区间和进行假设检验来量化抽样误差
主要随机抽样方法
- 简单随机抽样 (SRS):每个体等概率被选中,每个规模为 的样本等概率。需完整抽样框,通过随机数生成器抽取。优点:理论上最简单;缺点:大规模总体构建抽样框困难
- 系统抽样:按固定间隔 抽取,从1到间随机起始点。优点:实施简便,样本均匀分布;缺点:若抽样框存在周期性且与 重合则产生严重偏误
- 分层抽样:按已知特征(年龄、性别、地区)将总体分为互斥且穷尽的层,每层内独立随机抽样。按比例分配或非按比例分配。优点:确保所有关键子群代表性,层内同质可显著降低抽样误差;缺点:需先验知识,设计更复杂
- 整群抽样:将总体划分为群(按地理位置),随机抽取部分群后调查群内所有个体。优点:无需完整个体抽样框,经济可行;缺点:群内相似性(组内相关系数)增大抽样方差。多阶段抽样为延伸——多个阶段每阶段随机抽样(如城市→学校→班级),大型社会调查常用
随机抽样与随机分配的区别
两者常并存:先从全国随机抽样1000名患者(随机抽样),再随机分配500人服新药、500人服安慰剂(随机分配)。
抽样误差与样本量
抽样误差受样本量 影响:根据大数定律,样本量增加使样本均值趋近总体均值;根据中心极限定理,大样本下均值的抽样分布近似正态分布且标准误随样本量增加而减小。