ARTICLE
混合策略 (Mixed Strategy)
混合策略 (Mixed Strategy) 定义 混合策略(Mixed Strategy)是博弈论中的一个核心概念,指参与者在博弈中以某个概率分布随机选择其可用的纯策略(Pure Strategies)。与纯策略(即确定性地选择一个动作)不同,混合策略引入了随机性,允许参与者在多个纯策略之间以特定概率进行随机化选择。 形式上,对于一个策略集合 S_i = \
混合策略 (Mixed Strategy)
定义
混合策略(Mixed Strategy)是博弈论中的一个核心概念,指参与者在博弈中以某个概率分布随机选择其可用的纯策略(Pure Strategies)。与纯策略(即确定性地选择一个动作)不同,混合策略引入了随机性,允许参与者在多个纯策略之间以特定概率进行随机化选择。
形式上,对于一个策略集合 ,参与者 的混合策略 是一个概率分布 ,其中 且 , 表示参与者 选择纯策略 的概率。
混合策略均衡(Mixed Strategy Nash Equilibrium)
在纳什均衡中,每个参与者的策略必须是对其他参与者策略的最优反应。在混合策略纳什均衡中,每个参与者选择的混合策略使得对手的所有纯策略(以正概率被选择的纯策略)的期望收益相等。换句话说,参与者通过随机化使得对手没有动机偏离到某个纯策略。
混合策略纳什均衡的存在性由纳什定理(Nash, 1950)保证:任何有限博弈(参与者有限、策略有限)至少存在一个纳什均衡(可能包含混合策略)。
经典例子
1. 硬币匹配(Matching Pennies)
两名玩家各自选择正面或反面。若两人选择相同,玩家A赢;若选择不同,玩家B赢。这是一个零和博弈,没有纯策略纳什均衡,但存在唯一的混合策略纳什均衡:两名玩家各以 1/2 概率选择正面、1/2 概率选择反面。
计算过程:设玩家A以概率 选正面,玩家B以概率 选正面。玩家A的期望收益为 。要使玩家B无动机偏离,需使玩家A的收益独立于 ,即 ;同理可得 。
2. 猎鹿博弈(Stag Hunt)
两名猎人可选择合作猎鹿或单独猎兔。猎鹿需两人合作,每人收益 2;猎兔单人可以完成,每人收益 1。该博弈有两个纯策略纳什均衡(都猎鹿、都猎兔)和一个混合策略纳什均衡。
3. 鹰鸽博弈(Hawk-Dove)
两名玩家争夺资源 ,战斗成本为 。选择"鹰"(好斗)与"鸽"(和平)的配对不同收益不同。混合策略纳什均衡中,每个玩家以概率 选择"鹰"(若 )。
混合策略的解释
混合策略在经济学和社会学中有多种解释:
- 随机化行为:参与者在实际决策中确实进行随机化,如罚点球时的方向选择。
- 信念表征:混合策略不代表参与者真的随机化,而是表征其他参与者对某个参与者行为的不确定性。
- 群体频率:在大型群体中,混合策略可以解释为群体中选择某个纯策略的参与者比例。
- 策略性不确定性:混合策略是对手行为不确定性的数学描述。
混合策略的求解方法
求解混合策略纳什均衡的标准方法是利用无差异条件。在两人博弈中,设参与者1选择纯策略 的概率分别为 ,参与者2选择纯策略 的概率分别为 。参与者1在均衡中必须对其支撑集中所有纯策略无差异:
同样地,参与者2在其支撑集内也无差异。这一组方程加上概率和为1的条件,构成了求解混合策略均衡的线性方程组。
一个重要推论是:在混合策略纳什均衡中,参与者调整自己的混合概率并非为了使自己获得特定收益,而是为了使对手无差异。这一反直觉的结论是理解混合策略均衡的关键。
混合策略与纯策略的关系
混合策略与纯策略并非互斥关系。纯策略可以视为混合策略在概率退化为1时的特例。在策略空间中,混合策略构成了纯策略集合的凸包(Convex Hull)。某一混合策略的期望收益是各纯策略收益的加权平均。
混合策略纳什均衡的存在性比纯策略纳什均衡更广:并非所有博弈都有纯策略纳什均衡(如硬币匹配博弈),但每个有限博弈都有混合策略纳什均衡。这使得混合策略成为博弈论分析中的安全网。
混合策略的合理化
Harsanyi(1973)提出了一种重要的合理化思路。他认为,混合策略纳什均衡可以被解释为纯策略贝叶斯纳什均衡的极限情况。当参与者的收益存在微小扰动(即存在私人信息),且扰动的方差趋近于零时,贝叶斯纳什均衡的极限分布恰好对应于原来的混合策略纳什均衡。这一结论为混合策略提供了坚实的微观基础,使其不再仅仅是数学上的构造,而是具有信息经济学意义的现实行为描述。
混合策略的性质
- 无差异原理(Indifference Principle):在混合策略纳什均衡中,参与者必须对其以正概率选择的所有纯策略无差异,即这些策略的期望收益相等。
- 支撑集(Support):混合策略的支撑集指以正概率被选择的纯策略的集合。在均衡中,支撑集内的所有纯策略必须具有相同的期望收益,且不低于支撑集外的策略的期望收益。
- 退化情况:纯策略可以视为混合策略的特例(退化分布),即某个纯策略的概率为 1。
混合策略与扩展式博弈
在扩展式博弈(Extensive Form Games)中,混合策略与行为策略(Behavior Strategies)有所区别。行为策略在每个信息集(Information Set)上独立地定义概率分布。Kuhn定理(Kuhn, 1953)指出,在完美回忆(Perfect Recall)博弈中,每个混合策略等价于某个行为策略,反之亦然。
混合策略的应用
混合策略在以下领域有广泛应用:
- 产业组织:如随机定价、广告策略的不确定性
- 金融:交易策略中的随机化
- 军事与政治:威慑策略、核博弈中的相互确保摧毁
- 体育:罚球、发球等战术选择
- 进化博弈论(Evolutionary Game Theory):进化稳定策略(ESS)中的混合策略
批评与局限
一些学者对混合策略纳什均衡的概念提出批评:
- 直觉性问题:在新古典经济学中,参与者通常被认为是理性的,而随机化行为与"理性选择"的直觉相悖。
- 多重均衡:混合策略均衡可能不是唯一的,且纯策略均衡往往更直观。
- 实际预测能力:实验室实验表明,人类参与者的行为往往偏离混合策略均衡的预测。
- 弱稳定性:混合策略均衡在进化博弈中往往是进化不稳定的,除非进行适当的改造。
尽管如此,混合策略仍然是博弈论中不可或缺的工具,提供了纯策略纳什均衡无法覆盖的重要理论洞见。
参考文献
- Nash, J. (1950). "Equilibrium Points in n-Person Games." *Proceedings of the National Academy of Sciences*, 36(1), 48-49.
- Kuhn, H. W. (1953). "Extensive Games and the Problem of Information." In *Contributions to the Theory of Games*, Vol. 2, 193-216.
- Harsanyi, J. C. (1973). "Games with Randomly Disturbed Payoffs: A New Rationale for Mixed-Strategy Equilibrium Points." *International Journal of Game Theory*, 2(1), 1-23.
- Osborne, M. J. \& Rubinstein, A. (1994). *A Course in Game Theory*. MIT Press.
- Fudenberg, D. \& Tirole, J. (1991). *Game Theory*. MIT Press.