ARTICLE

滚雪球抽样

滚雪球抽样(Snowball Sampling)是一种非概率抽样方法,主要应用于难以通过常规渠道接触的、规模较小或分布隐蔽的特定人群。其名称来源于"滚雪球"这一形象的比喻——雪球在滚动中不断吸附新雪,越滚越大,正如样本通过已有受访者的社会网络层层推荐,逐步扩大规模。该方法最早在社会学与人类学领域中被系统使用,如今已成为跨学科研究中应对"隐蔽总体"(hidde

浏览 1 更新 2025-10-26

滚雪球抽样(Snowball Sampling)是一种非概率抽样方法,主要应用于难以通过常规渠道接触的、规模较小或分布隐蔽的特定人群。其名称来源于"滚雪球"这一形象的比喻——雪球在滚动中不断吸附新雪,越滚越大,正如样本通过已有受访者的社会网络层层推荐,逐步扩大规模。该方法最早在社会学与人类学领域中被系统使用,如今已成为跨学科研究中应对"隐蔽总体"(hidden population)问题的核心工具之一。

基本原理与操作流程

滚雪球抽样的起点是研究者通过某种途径找到少数符合研究条件的初始受访者,通常称为"种子"(seeds)。种子的选择对最终样本的质量具有关键影响,研究者通常会从多个不同渠道选取种子,以尽可能地增加样本的异质性。随后,研究者请求这些种子受访者推荐其他符合条件的人加入样本。新加入的受访者继续向前推荐,如此往复,直到样本规模达到研究需要或信息达到饱和状态为止。整个过程呈现链式递推的特征,因此该方法也被称为链式推荐抽样(Chain Referral Sampling)。在实施过程中,研究者通常需要记录推荐者的关系网络图谱,以便后续追踪样本的传播路径和潜在偏误来源。

典型应用场景

这一方法在社会科学、公共卫生、犯罪学等领域具有广泛的应用。在公共卫生领域,滚雪球抽样常用于研究注射吸毒者、性工作者、男男性行为者等高危人群,用以评估艾滋病等传染病的传播风险与干预效果。由于这些群体往往因社会污名化而隐匿于公众视野之外,传统的随机抽样或电话调查几乎无法触及,滚雪球抽样便成为流行病学调查的"最后一公里"工具。在社会学研究中,该方法被用于接触无家可归者、移民群体、地下经济体从业者等难以通过户籍、电话簿或社区名单定位的群体。此外,在组织行为研究中,当需要接触特定行业的高管或掌握关键信息的内部人士时,滚雪球抽样也是一种常见策略——高层管理者往往时间有限、隐私意识强,经同业推荐可大幅降低拒访率。在互联网研究领域,通过社交平台进行的在线滚雪球抽样正变得日益流行,研究者通过种子用户的分享与转发,可以在短时间内触达分布广泛的目标人群。

方法优势

滚雪球抽样的首要优势在于其可达性(accessibility)。对于隐蔽人群或边缘群体,概率抽样方法往往因缺乏完整的抽样框而无法实施,滚雪球抽样则提供了一个可操作的替代方案。其次,该方法的实施成本较低、操作灵活,研究者无需复杂的抽样设备或大规模的前期调研,仅凭人际网络即可逐步扩展样本。这在资源有限的小规模研究或探索性研究中尤为重要。此外,受访者之间的信任关系有助于降低拒访率——经熟人引荐的潜在受访者往往更愿意参与研究,也更倾向于提供真实、详细的信息。对于研究主题涉及敏感行为或非法活动的调查,这种基于信任的招募机制具有不可替代的人文关怀意义,能够减少受访者的心理防御。

局限性与偏误风险

滚雪球抽样在方法论上存在若干明显的局限。最为突出的是选择偏误(selection bias)问题:样本高度依赖于"种子"的社会网络特征,具有同质性倾向——即受访者倾向于推荐与其社会地位、观点、行为方式相似的人,导致样本缺乏异质性,难以代表更广泛的总体。这种同质性使得通过滚雪球抽样获得的样本在关键变量上可能存在系统性偏差,限制了研究结论的外部效度。此外,该方法无法基于概率理论计算抽样误差,不适用于需要统计推断的定量研究。另一个问题是"友伴偏误"(friendship bias):社会网络规模较大的个体被选入样本的概率远高于"孤岛型"个体,造成样本对社会网络活跃者的过度代表。同时,由于缺乏明确的终止规则,研究者可能难以判断何时停止招募,过度依赖某一条推荐链也可能加剧样本偏倚。

改进与变体

为缓解上述局限,研究者发展了若干改进版本。应答驱动抽样(Respondent-Driven Sampling, RDS)是其中最具代表性的一种。RDS由Heckathorn于1997年提出,通过引入双重激励机制——既奖励参与,也奖励推荐他人入样——并记录完整的推荐关系网络,再借助马尔可夫链模型对样本进行加权校正,从而在一定程度上实现了对总体参数的无偏估计。RDS已被世界卫生组织推荐为艾滋病高危人群监测的标准工具之一。另一种变体是目标抽样(Targeted Sampling),即在滚雪球过程中设定明确的配额指标,确保样本在关键人口学变量如性别、年龄、地域上保持一定的多样性。定性研究中也常用"理论抽样"(Theoretical Sampling)策略,由Glaser和Strauss在扎根理论中提出,强调根据理论发展的需要而非社会网络便利性来指导样本的后续招募方向。

总结

滚雪球抽样是一种以社会网络为基础的实用型非概率抽样方法,在无法使用概率抽样的情况下为研究者提供了接触隐蔽人群的有效途径。尽管存在同质性和选择偏误等问题,但通过引入应答驱动抽样、理论抽样等改进策略,其方法论价值得到了显著提升。在使用该方法时,研究者应当充分认识其局限性,在报告中明确说明抽样策略及潜在的偏误风险,并尽可能通过多种种子来源与配额控制来提升样本的代表性。在定性研究和探索性研究中,滚雪球抽样依然占据不可替代的地位。