ARTICLE

群体遗传学

群体遗传学 (Population Genetics) 群体遗传学是遗传学的一个核心分支,研究生物群体中等位基因频率的分布、维持和变化规律。它以孟德尔遗传定律和达尔文自然选择理论的现代综合为基础,运用数学和统计学方法,定量描述进化过程在群体层面上的微观机制。群体遗传学是连接分子遗传学与进化生物学的桥梁学科,其理论框架构成了现代进化综合 (Modern Syn

浏览 0 更新 2025-11-08

群体遗传学 (Population Genetics)

群体遗传学遗传学的一个核心分支,研究生物群体中等位基因频率的分布、维持和变化规律。它以孟德尔遗传定律达尔文自然选择理论的现代综合为基础,运用数学和统计学方法,定量描述进化过程在群体层面上的微观机制。群体遗传学是连接分子遗传学与进化生物学的桥梁学科,其理论框架构成了现代进化综合 (Modern Synthesis) 的数学核心。

群体遗传学的奠基性工作始于20世纪初。英国数学家哈代 (G. H. Hardy) 和德国医生温伯格 (Wilhelm Weinberg) 于1908年独立提出了遗传平衡定律,此后费希尔 (R. A. Fisher)、霍尔丹 (J. B. S. Haldane) 和赖特 (Sewall Wright) 三人在1920—1930年代将该学科系统化、数学化,奠定了经典群体遗传学的理论基石。

哈代-温伯格平衡

哈代-温伯格平衡 (Hardy–Weinberg Equilibrium, HWE) 是群体遗传学的第一原理。考虑一个具有两个等位基因 A 和 a 的基因座,设 A 的频率为 pp,a 的频率为 qq(满足 p+q=1p + q = 1)。在随机交配的无限大群体中,若不存在突变、选择、迁移和随机漂变,则基因型频率在世代间保持恒定:

f(AA)=p2,f(Aa)=2pq,f(aa)=q2f(AA) = p^2, \quad f(Aa) = 2pq, \quad f(aa) = q^2

HWE 的核心意义在于它为检测进化力量提供了零假设:一旦观测到的基因型频率显著偏离 HWE 预期,即可推断群体中至少有一种进化力在起作用(如近交自然选择群体分层基因流)。在人类遗传学中,HWE 检验是全基因组关联研究 (GWAS) 质量控制的标准步骤之一,用于排除基因分型错误和群体混杂。

进化的四大驱动力

群体遗传学将进化定义为世代间等位基因频率的变化,识别出四种基本进化力量:

  • 突变 (Mutation):遗传物质的可遗传变化,是全部遗传变异的最终来源。突变率通常极低,在每代每位点约 10510^{-5}10610^{-6} 量级。尽管单次突变的直接效应微弱,但突变通过与选择、漂变的相互作用,长期维持群体的遗传多样性。无限等位基因模型阶梯突变模型是描述突变过程的经典数学模型。
  • 自然选择 (Natural Selection):不同基因型对生存和繁殖成功的差异贡献。选择强度以适合度 (fitness, ww) 度量,选择系数 s=1ws = 1 - w 量化不利等位基因的劣势程度。选择清除有害突变的效率取决于 ss有效群体大小 NeN_e 的乘积:当 Nes1N_e s \ll 1 时,漂变主导;当 Nes1N_e s \gg 1 时,选择主导。正向选择会产生选择性清除,在其周围留下搭便车效应的信号。
  • 遗传漂变 (Genetic Drift):由于有限群体中随机抽样误差导致的等位基因频率波动。漂变是进化中最重要的随机因素。根据赖特-费希尔模型,一个大小为 NN 的二倍体群体中,等位基因频率的世代间方差为: \[ \operatorname{Var}(\Delta p) = \frac{p(1-p)}{2N} \] 漂变导致遗传多样性以每代 1/(2Ne)1/(2N_e) 的速率丧失,最终使一个等位基因固定(频率达到1),其他等位基因消失。有效群体大小 NeN_e 通常远小于普查数 NN,受繁殖方差、性别比例、世代重叠和群体历史波动影响。
  • 基因流 (Gene Flow):个体或配子在群体间的迁移导致等位基因的引入或移出。基因流倾向于均质化群体间的等位基因频率,对抗局域适应和漂变。大陆-岛屿模型踏脚石模型是描述基因流空间结构的标准框架。迁移-漂变平衡刻画了 NemN_e m(有效群体大小与迁移率的乘积)决定的群体分化程度。

群体结构与F统计量

赖特提出的F统计量是量化群体遗传结构的基本工具。三个层级的内繁系数——FISF_{IS}(个体相对于亚群体的近交)、FSTF_{ST}(亚群体相对于总群体的分化)和 FITF_{IT}(个体相对于总群体的近交)——满足关系:

(1FIT)=(1FIS)(1FST)(1 - F_{IT}) = (1 - F_{IS})(1 - F_{ST})

其中 FSTF_{ST} 是最广泛使用的群体分化度量。对于双等位基因座,FSTF_{ST} 可表示为等位基因频率的标准化方差:

FST=Var(p)pˉ(1pˉ)F_{ST} = \frac{\operatorname{Var}(p)}{\bar{p}(1 - \bar{p})}

其中 pˉ\bar{p} 为平均等位基因频率。FSTF_{ST} 的范围从 0(完全无分化)到 1(完全分化)。在人类群体中,全球 FSTF_{ST} 约在 0.05—0.15 之间,表明绝大多数遗传变异存在于群体内部而非群体之间。FSTF_{ST} 在保护遗传学、法医学和关联分析中均有重要应用。

中性理论与分子进化

1968年,木村资生提出分子进化的中性理论,对选择主导的传统观点构成挑战。该理论主张:在分子水平上,绝大多数固定下来的突变在选择上是中性的(即 s0s \approx 0),其命运由遗传漂变决定,而非自然选择。

中性理论的核心预测是分子进化的恒定速率:一个群体中突变的中性固定速率等于突变率,与群体大小无关:

k=μk = \mu

其中 kk 为每位点每代的替换率,μ\mu 为中性突变率。这为分子钟假说提供了理论基础,使利用 DNA 序列差异推算物种分歧时间成为可能。尽管完全中性论存在争议,近中性理论 (Ohta, 1973) 将轻微有害突变纳入分析框架,进一步完善了分子进化的理论图景。

溯祖理论

溯祖理论 (Coalescent Theory) 由金曼 (J. F. C. Kingman) 于1982年建立,是群体遗传学现代统计分析的核心工具。与传统的"前向"模型(追踪等位基因频率变化)不同,溯祖理论采用"后向"视角:从当前样本出发,追溯其共同祖先。对于样本量为 nn赖特-费希尔模型,两个谱系在上一世代溯祖至同一祖先的概率为 1/(2N)1/(2N),相邻溯祖事件之间的等待时间服从指数分布,均值为 4N/[k(k1)]4N/[k(k-1)] 代(其中 kk 为当前谱系数)。

溯祖理论为估计群体历史参数(有效群体大小、群体分化时间、迁移率)和检测自然选择信号提供了似然框架和贝叶斯推断基础。

现代应用

当代群体遗传学与基因组学深度融合。全基因组关联研究 (GWAS) 依赖群体遗传学原理校正群体分层和检测多基因适应信号。人类群体历史推断——如走出非洲尼安德特人混血事件——均借助溯祖理论和主成分分析 (PCA) 方法。在保护生物学中,FSTF_{ST}杂合度有效群体大小的估计用于评估濒危物种的遗传健康。在癌症演化领域,群体遗传学的漂变-选择框架被用于建模肿瘤内部的克隆竞争和耐药性出现。