ARTICLE

混合策略 (Mixed Strategy)

混合策略 (Mixed Strategy) 定义 混合策略(Mixed Strategy)是博弈论中的一个核心概念,指参与者在博弈中以某个概率分布随机选择其可用的纯策略(Pure Strategies)。与纯策略(即确定性地选择一个动作)不同,混合策略引入了随机性,允许参与者在多个纯策略之间以特定概率进行随机化选择。 形式上,对于一个策略集合 S_i = \

浏览 0 更新 2025-10-26

混合策略 (Mixed Strategy)

定义

混合策略(Mixed Strategy)是博弈论中的一个核心概念,指参与者在博弈中以某个概率分布随机选择其可用的纯策略(Pure Strategies)。与纯策略(即确定性地选择一个动作)不同,混合策略引入了随机性,允许参与者在多个纯策略之间以特定概率进行随机化选择。

形式上,对于一个策略集合 Si={si1,si2,,sin} S_i = \{s_{i1}, s_{i2}, \dots, s_{in}\} ,参与者 i i 的混合策略 σi \sigma_i 是一个概率分布 σi=(p1,p2,,pn) \sigma_i = (p_1, p_2, \dots, p_n) ,其中 pj0 p_j \geq 0 j=1npj=1 \sum_{j=1}^n p_j = 1 pj p_j 表示参与者 i i 选择纯策略 sij s_{ij} 的概率。

混合策略均衡(Mixed Strategy Nash Equilibrium)

在纳什均衡中,每个参与者的策略必须是对其他参与者策略的最优反应。在混合策略纳什均衡中,每个参与者选择的混合策略使得对手的所有纯策略(以正概率被选择的纯策略)的期望收益相等。换句话说,参与者通过随机化使得对手没有动机偏离到某个纯策略。

混合策略纳什均衡的存在性由纳什定理(Nash, 1950)保证:任何有限博弈(参与者有限、策略有限)至少存在一个纳什均衡(可能包含混合策略)。

经典例子

1. 硬币匹配(Matching Pennies)

两名玩家各自选择正面或反面。若两人选择相同,玩家A赢;若选择不同,玩家B赢。这是一个零和博弈,没有纯策略纳什均衡,但存在唯一的混合策略纳什均衡:两名玩家各以 1/2 概率选择正面、1/2 概率选择反面。

计算过程:设玩家A以概率 p p 选正面,玩家B以概率 q q 选正面。玩家A的期望收益为 pq1+p(1q)(1)+(1p)q(1)+(1p)(1q)1=(2p1)(2q1) pq \cdot 1 + p(1-q) \cdot (-1) + (1-p)q \cdot (-1) + (1-p)(1-q) \cdot 1 = (2p-1)(2q-1) 。要使玩家B无动机偏离,需使玩家A的收益独立于 q q ,即 p=1/2 p = 1/2 ;同理可得 q=1/2 q = 1/2

2. 猎鹿博弈(Stag Hunt)

两名猎人可选择合作猎鹿或单独猎兔。猎鹿需两人合作,每人收益 2;猎兔单人可以完成,每人收益 1。该博弈有两个纯策略纳什均衡(都猎鹿、都猎兔)和一个混合策略纳什均衡。

3. 鹰鸽博弈(Hawk-Dove)

两名玩家争夺资源 V V ,战斗成本为 C C 。选择"鹰"(好斗)与"鸽"(和平)的配对不同收益不同。混合策略纳什均衡中,每个玩家以概率 p=V/C p = V/C 选择"鹰"(若 V<C V < C )。

混合策略的解释

混合策略在经济学和社会学中有多种解释:

  1. 随机化行为:参与者在实际决策中确实进行随机化,如罚点球时的方向选择。
  2. 信念表征:混合策略不代表参与者真的随机化,而是表征其他参与者对某个参与者行为的不确定性。
  3. 群体频率:在大型群体中,混合策略可以解释为群体中选择某个纯策略的参与者比例。
  4. 策略性不确定性:混合策略是对手行为不确定性的数学描述。

混合策略的求解方法

求解混合策略纳什均衡的标准方法是利用无差异条件。在两人博弈中,设参与者1选择纯策略 a1,a2,,am a_1, a_2, \dots, a_m 的概率分别为 p1,p2,,pm p_1, p_2, \dots, p_m ,参与者2选择纯策略 b1,b2,,bn b_1, b_2, \dots, b_n 的概率分别为 q1,q2,,qn q_1, q_2, \dots, q_n 。参与者1在均衡中必须对其支撑集中所有纯策略无差异:

E[u1(ai,σ2)]=E[u1(aj,σ2)],ai,ajsupp(σ1)\mathbb{E}[u_1(a_i, \sigma_2)] = \mathbb{E}[u_1(a_j, \sigma_2)], \quad \forall a_i, a_j \in \text{supp}(\sigma_1)

同样地,参与者2在其支撑集内也无差异。这一组方程加上概率和为1的条件,构成了求解混合策略均衡的线性方程组。

一个重要推论是:在混合策略纳什均衡中,参与者调整自己的混合概率并非为了使自己获得特定收益,而是为了使对手无差异。这一反直觉的结论是理解混合策略均衡的关键。

混合策略与纯策略的关系

混合策略与纯策略并非互斥关系。纯策略可以视为混合策略在概率退化为1时的特例。在策略空间中,混合策略构成了纯策略集合的凸包(Convex Hull)。某一混合策略的期望收益是各纯策略收益的加权平均。

混合策略纳什均衡的存在性比纯策略纳什均衡更广:并非所有博弈都有纯策略纳什均衡(如硬币匹配博弈),但每个有限博弈都有混合策略纳什均衡。这使得混合策略成为博弈论分析中的安全网。

混合策略的合理化

Harsanyi(1973)提出了一种重要的合理化思路。他认为,混合策略纳什均衡可以被解释为纯策略贝叶斯纳什均衡的极限情况。当参与者的收益存在微小扰动(即存在私人信息),且扰动的方差趋近于零时,贝叶斯纳什均衡的极限分布恰好对应于原来的混合策略纳什均衡。这一结论为混合策略提供了坚实的微观基础,使其不再仅仅是数学上的构造,而是具有信息经济学意义的现实行为描述。

混合策略的性质

  1. 无差异原理(Indifference Principle):在混合策略纳什均衡中,参与者必须对其以正概率选择的所有纯策略无差异,即这些策略的期望收益相等。
  2. 支撑集(Support):混合策略的支撑集指以正概率被选择的纯策略的集合。在均衡中,支撑集内的所有纯策略必须具有相同的期望收益,且不低于支撑集外的策略的期望收益。
  3. 退化情况:纯策略可以视为混合策略的特例(退化分布),即某个纯策略的概率为 1。

混合策略与扩展式博弈

在扩展式博弈(Extensive Form Games)中,混合策略与行为策略(Behavior Strategies)有所区别。行为策略在每个信息集(Information Set)上独立地定义概率分布。Kuhn定理(Kuhn, 1953)指出,在完美回忆(Perfect Recall)博弈中,每个混合策略等价于某个行为策略,反之亦然。

混合策略的应用

混合策略在以下领域有广泛应用:

  • 产业组织:如随机定价、广告策略的不确定性
  • 金融:交易策略中的随机化
  • 军事与政治:威慑策略、核博弈中的相互确保摧毁
  • 体育:罚球、发球等战术选择
  • 进化博弈论(Evolutionary Game Theory):进化稳定策略(ESS)中的混合策略

批评与局限

一些学者对混合策略纳什均衡的概念提出批评:

  1. 直觉性问题:在新古典经济学中,参与者通常被认为是理性的,而随机化行为与"理性选择"的直觉相悖。
  2. 多重均衡:混合策略均衡可能不是唯一的,且纯策略均衡往往更直观。
  3. 实际预测能力:实验室实验表明,人类参与者的行为往往偏离混合策略均衡的预测。
  4. 弱稳定性:混合策略均衡在进化博弈中往往是进化不稳定的,除非进行适当的改造。

尽管如此,混合策略仍然是博弈论中不可或缺的工具,提供了纯策略纳什均衡无法覆盖的重要理论洞见。

参考文献

  • Nash, J. (1950). "Equilibrium Points in n-Person Games." *Proceedings of the National Academy of Sciences*, 36(1), 48-49.
  • Kuhn, H. W. (1953). "Extensive Games and the Problem of Information." In *Contributions to the Theory of Games*, Vol. 2, 193-216.
  • Harsanyi, J. C. (1973). "Games with Randomly Disturbed Payoffs: A New Rationale for Mixed-Strategy Equilibrium Points." *International Journal of Game Theory*, 2(1), 1-23.
  • Osborne, M. J. \& Rubinstein, A. (1994). *A Course in Game Theory*. MIT Press.
  • Fudenberg, D. \& Tirole, J. (1991). *Game Theory*. MIT Press.