# 整群抽样 (Cluster Sampling)
整群抽样 (Cluster Sampling),也称为 聚类抽样,是一种{{{概率抽样}}}方法。在这种方法中,研究人员将目标{{{总体}}} (population) 分割成多个互不重叠的子集,这些子集被称为 群 (clusters)。然后,研究人员不是从总体中直接抽取个体,而是随机抽取一部分“群”,并将被抽中群内的所有(或部分)个体作为样本。
整群抽样的核心思想在于,将抽样的基本单位从个体转变为群体,这在许多实际研究场景中,尤其是在面对地理上分散或组织结构上分层的总体时,能够显著提高抽样的经济性和可行性。
## 整群抽样的原理与步骤
整群抽样的实施过程可以分解为以下几个关键步骤:
1. 界定目标总体:明确研究所要推断的全部个体范围。例如,一个国家的所有中学生。
2. 划分群组 (Clusters):将总体按照某个标准划分为若干个群。理想的群应该具备两个特征: * 群内异质性 (Internal Heterogeneity):每个群的内部构成应尽可能多样化,像一个“微缩版的总体”。例如,一个理想的城市群,其居民的收入、年龄、教育水平分布应与整个国家的人口分布相似。 * 群间同质性 (External Homogeneity):各个群之间应尽可能相似。也就是说,任意一个群都能很好地代表总体。
3. 随机抽取群组:编制所有群的列表(即{{{抽样框}}}),然后使用{{{简单随机抽样}}}或其他概率抽样方法从中抽取一定数量的群。例如,从全国 200 个城市群中,随机抽取 15 个城市。
4. 数据收集:对被抽中的群内所有个体进行调查和数据收集。这被称为 单阶段整群抽样。如果在此基础上再进行抽样,则为多阶段抽样(见下文)。
## 整群抽样的类型
根据抽样阶段的次数,整群抽样可以主要分为:
* 单阶段整群抽样 (One-Stage Cluster Sampling) 这是最基础的整群抽样形式。在随机抽取群之后,将群内 所有 的个体都纳入最终的样本中。例如,为了调查某市的小学生健康状况,研究人员将全市所有小学作为群,随机抽取10所小学,然后对这10所小学里的 每一位 学生进行调查。
* 两阶段整群抽样 (Two-Stage Cluster Sampling) 当被抽中的群规模过大时,调查群内所有个体仍然成本高昂或不切实际。此时可以采用两阶段抽样。 * 第一阶段:与单阶段抽样相同,首先随机抽取群(称为初级抽样单位,PSU)。 * 第二阶段:在每个被抽中的群内,不再包含所有个体,而是进行第二次随机抽样,从中抽取一部分个体(称为次级抽样单位,SSU)构成最终样本。 例如,在上面的小学生健康调查中,研究人员随机抽取10所小学后,在每所被抽中的小学里再随机抽取50名学生进行调查。
* 多阶段整群抽样 (Multi-Stage Cluster Sampling) 这是两阶段抽样的延伸,包含两个以上的抽样层次。这种方法常见于大规模的全国性调查。例如,一项全国性调查可以这样设计:第一阶段抽样省份,第二阶段在抽中的省份里抽样城市,第三阶段在抽中的城市里抽样社区,第四阶段在抽中的社区里抽样家庭。
## 与其他抽样方法的比较
为了更深刻地理解整群抽样,必须将其与{{{分层抽样}}}进行对比,因为两者都涉及将总体分组。
### 整群抽样 vs. 分层抽样 (Stratified Sampling)
| 特征 | 整群抽样 (Cluster Sampling) | {{{分层抽样}}} (Stratified Sampling) | | :--- | :--- | :--- | | 分组目标 | 为了成本效益和可行性。 | 为了提高精度和代表性。 | | 组内特征 | 群内成员应 异质 (Heterogeneous),每个群都是总体的缩影。 | 层内成员应 同质 (Homogeneous),成员特征相似。 | | 组间特征 | 各个群之间应 同质 (Homogeneous),即群与群之间很相似。 | 各个层之间应 异质 (Heterogeneous),层与层之间差异明显。 | | 抽样方式 | 从 所有群中随机抽取一部分群,然后调查被抽中群的全部或部分成员。 | 从 每一个层中都抽取 一部分成员。 | | {{{抽样误差}}} | 通常比同等规模的简单随机抽样或分层抽样要 高。 | 通常比同等规模的简单随机抽样要 低。 |
一个简单的记忆方法是:在分层抽样中,你深入 每一片 土地(层);在整群抽样中,你只选择 几片 土地(群)并对其进行全面勘探。
## 优缺点分析
### 优点
1. 成本效益高:当总体分布在广阔的地理区域时,整群抽样可以将调查工作集中在少数几个地理位置,从而大大节省差旅、时间和人力成本。 2. 可行性强:在很多情况下,获取整个总体的个体名单(即完整的抽样框)是不可能的。但获取一个由群组成的名单(如全国所有学校的名单、所有医院的名单)则相对容易。 3. 管理方便:将调查团队派往少数几个集中的区域进行管理,比派往全国各地分散的个体处要容易得多。
### 缺点
1. {{{抽样误差}}}较大:这是整群抽样最主要的缺点。因为同一个群内的个体往往比从整个总体中随机抽取的个体更相似(例如,同一所学校的学生家庭背景可能更类似),这种现象称为 簇内相关性 (Intra-cluster Correlation, ICC)。正的ICC会降低样本的多样性,从而增加估计值的{{{方差}}},导致抽样误差增大。这意味着,在样本量相同的情况下,整群抽样的结果精度通常低于{{{简单随机抽样}}}。 2. 分析复杂性:由于数据点之间并非相互独立(同一群内的观测值是相关的),因此在进行{{{统计推断}}}时,不能直接使用为简单随机抽样设计的标准公式(如计算{{{标准误}}}或{{{置信区间}}})。必须采用更复杂的统计方法来调整“聚类效应”(clustering effect),否则会低估真实的标准误,导致错误的结论。
## 应用场景
整群抽样特别适用于以下情况:
* 当目标总体在地理上非常分散,而预算和时间有限时。例如,对一个国家或一个大省的居民进行面对面访谈。 * 当无法获得完整的个体抽样框,但可以获得群的抽样框时。例如,无法得到全国所有学生的名单,但可以得到全国所有学校的名单。 * 当研究的自然单位就是群组时。例如,评估不同教学方法对班级整体学习氛围的影响,此时抽样的单位就是班级。
## 数学视角:设计效应 (Design Effect)
为了量化整群抽样对精度的影响,统计学家引入了 设计效应 (DEFF) 的概念。设计效应定义为: $$ \text{DEFF} = \frac{\text{Var}(\hat{\theta}_{\text{cluster}})}{\text{Var}(\hat{\theta}_{\text{srs}})} $$ 其中,$\text{Var}(\hat{\theta}_{\text{cluster}})$ 是在整群抽样下估计量 $\hat{\theta}$ 的方差,$\text{Var}(\hat{\theta}_{\text{srs}})$ 是在同等样本规模的简单随机抽样下该估计量的方差。
对于单阶段整群抽样,设计效应可以用簇内相关性 ${\rho}$ (rho) 近似表示: $$ \text{DEFF} \approx 1 + (M - 1)\rho $$ 这里,$M$ 是每个群的平均大小,${\rho}$ 是簇内相关性系数,衡量群内个体之间某一变量的相似程度。
* 如果 ${\rho > 0}$(通常情况下都是如此),则 $\text{DEFF} > 1$,表明整群抽样的方差大于简单随机抽样,精度有所损失。 * ${\rho}$ 越大或群规模 $M$ 越大,DEFF 就越大,抽样效率越低。
这一公式清晰地揭示了整群抽样为获得操作便利性而在统计精度上付出的代价。