ARTICLE

演化稳定策略

演化稳定策略 (Evolutionarily Stable Strategy, ESS) 演化稳定策略 (Evolutionarily Stable Strategy, ESS) 是演化博弈论 (Evolutionary Game Theory) 中一个奠基性的解概念,由英国生物学家约翰·梅纳德·史密斯 (John Maynard Smith) 和遗传学家乔

浏览 5 更新 2025-10-26

演化稳定策略 (Evolutionarily Stable Strategy, ESS)

演化稳定策略 (Evolutionarily Stable Strategy, ESS) 是演化博弈论 (Evolutionary Game Theory) 中一个奠基性的解概念,由英国生物学家约翰·梅纳德·史密斯 (John Maynard Smith) 和遗传学家乔治·普莱斯 (George R. Price) 于 1973 年在《自然》杂志上正式提出。它将博弈论的均衡思想引入演化生物学,为解释物种在自然选择压力下行为模式的稳定性提供了严格的数学框架。

与经典博弈论以个体理性为出发点不同,ESS 的出发点是一个大种群 (Large Population) ——个体在种群中随机配对进行重复博弈,适应性(或支付)更高的策略将在演化过程中占据优势。ESS 描述的是这样一种策略状态:如果种群中绝大多数个体都采用该策略,那么任何小规模的突变策略 (Mutant Strategy) 都无法成功入侵该种群。换言之,ESS 是一种能够抵抗来自任何替代策略入侵的演化稳态

形式化定义 (Formal Definition)

设博弈为两人对称博弈,每个参与者的策略集为 SS。记 u(x,y)u(x, y) 为策略 xx 对策略 yy 的期望支付(即当自己使用 xx、对手使用 yy 时自身的收益)。

一个策略 xSx^* \in S 被称为演化稳定策略,当且仅当对于任意突变策略 xxx \neq x^*,存在一个入侵壁垒 εˉ>0\bar{\varepsilon} > 0,使得对于所有 ε(0,εˉ)\varepsilon \in (0, \bar{\varepsilon}),以下不等式成立:

u(x,εx+(1ε)x)>u(x,εx+(1ε)x)u(x^*, \varepsilon x + (1 - \varepsilon)x^*) > u(x, \varepsilon x + (1 - \varepsilon)x^*)

这一不等式的含义是:在一个种群中,当绝大多数个体(比例 1ε1-\varepsilon)采用 xx^*、仅少数突变者(比例 ε\varepsilon)采用 xx 时,原有策略 xx^* 的期望支付严格高于突变策略 xx,从而使突变策略最终被淘汰。

一个更为实用的等价刻画是以下两个条件。对任意 xxx \neq x^*

  1. 均衡条件 (Equilibrium Condition)u(x,x)u(x,x)u(x^*, x^*) \ge u(x, x^*),即 xx^* 是对自身的最佳应对。这意味着 (x,x)(x^*, x^*) 构成一个纳什均衡
  2. 稳定性条件 (Stability Condition):如果 u(x,x)=u(x,x)u(x^*, x^*) = u(x, x^*)(即 xx 也是 xx^* 的最佳应对),则必须满足 u(x,x)>u(x,x)u(x^*, x) > u(x, x),即 xx^* 在对抗突变策略 xx 时比 xx 自身做得更好。

第一个条件保证了策略 xx^* 在种群内部不会被替代——它是纳什均衡,因此没有个体能通过单方面偏离而受益。第二个条件则处理了替代最佳应对 (Alternative Best Response) 的情形:如果有另一个策略 xx 在面对 xx^* 时表现同样好,那么 xx^* 必须在对抗 xx 自身时表现更优,从而在种群中形成对突变者的选择性压制。

由此可见,每个 ESS 都是一个纳什均衡,但并非所有纳什均衡都是演化稳定的。ESS 是一种精炼 (Refinement) 的纳什均衡。

经典示例:鹰鸽博弈 (Hawk-Dove Game)

鹰鸽博弈是解释 ESS 概念最经典的模型。考虑一个种群中的个体为争夺资源而发生冲突,每只个体可以采取两种策略:

  • 鹰派 (Hawk):采取攻击性行为,不惜一战以获取资源。
  • 鸽派 (Dove):采取和平姿态,遇到攻击则退缩以避免冲突。

设资源的价值为 VV,激烈冲突导致的受伤成本为 C>VC > V。支付矩阵如下:

  • 鹰 vs. 鹰:各以 50\% 概率获胜并获得资源 VV,50\% 概率受伤承担成本 CC,期望收益为 VC2\frac{V - C}{2}
  • 鹰 vs. 鸽:鹰获得全部资源 VV,鸽获得 0。
  • 鸽 vs. 鹰:鸽获得 0,鹰获得 VV
  • 鸽 vs. 鸽:和平分享资源,各得 V2\frac{V}{2}

纯策略鹰 (H)(H) 不是 ESS:因为当种群中全是鹰时,个体期望收益为 VC2<0\frac{V - C}{2} < 0(因 C>VC > V),而鸽派突变者面对鹰将获得 0,优于鹰派内部的互损。因此鸽派可以入侵全鹰种群。

纯策略鸽 (D)(D) 也不是 ESS:全鸽种群中每个个体获得 V2\frac{V}{2},但鹰派突变者面对鸽将获得 V>V2V > \frac{V}{2},因此鹰派可入侵全鸽种群。

该博弈唯一的 ESS 是混合策略:以概率 VC\frac{V}{C} 选择鹰态,以概率 1VC1 - \frac{V}{C} 选择鸽态。在这个混合比例下,鹰和鸽的期望收益相等,任何偏离该比例的突变者都无法获得更高的期望支付。这一混合策略同时满足均衡条件和稳定性的两个条件,从而构成 ESS。

ESS 与纳什均衡的关系

演化稳定策略是纳什均衡的一个严格子集。具体而言:

ESS对称纳什均衡纳什均衡\text{ESS} \subset \text{对称纳什均衡} \subset \text{纳什均衡}

一个对称博弈中的 ESS 必然是该博弈的对称纳什均衡且满足稳定性条件。反过来的典型例子是某些纳什均衡虽然满足均衡条件,但无法抵抗突变策略的入侵,因此不具备演化稳定性。

此外,在实践中,ESS 的概念也与复制子动态 (Replicator Dynamics) 密切相关。在复制子动态下,一个策略的增长率与其相对支付成正比。可以证明,ESS 是复制子动态的渐近稳定不动点——种群一旦接近 ESS 状态,动态过程将自动将其拉回该均衡,而非远离。

应用领域 (Applications)

  • 演化生物学:解释动物行为的演化起源,如领地防卫、仪式化争斗、利他行为和合作行为的涌现。例如,为什么许多物种的雄性在争夺配偶时更多进行仪式化展示而非殊死搏斗——鹰鸽博弈中的混合 ESS 提供了清晰的解释。
  • 经济学:分析产业组织中的市场竞争策略、企业惯例的演化与扩散,以及社会规范的稳定性。例如,特定的商业惯例(如"优质服务"或"低价策略")能否在市场竞争中持续存续,可以借助 ESS 框架加以评估。
  • 社会学与人类学:研究文化规范、语言演化、社会习俗的形成与维持。ESS 所处理的"抵抗入侵"概念与社会中的从众压力和制度演变直接对应。
  • 计算机科学:在多智能体系统 (Multi-agent Systems) 和人工智能中,ESS 为设计稳定、自适应的智能体行为提供了理论指导,尤其应用于分布式优化和自组织网络。

总结

演化稳定策略是对经典纳什均衡的演化精炼。它不依赖于高强度的理性假设,而是从种群动力学和自然选择的视角解释策略的稳定性。通过两个简洁的条件——均衡条件与稳定性条件——ESS 准确地刻画了一种"一旦占优便难以被推翻"的策略特征,成为连接博弈论与演化生物学的关键桥梁,并在经济学、社会学和计算机科学中展现出广泛的分析价值。