ARTICLE

混合策略 (Mixed Strategy)

混合策略 (Mixed Strategy) 定义混合策略（Mixed Strategy）是博弈论中的一个核心概念，指参与者在博弈中以某个概率分布随机选择其可用的纯策略（Pure Strategies）。与纯策略（即确定性地选择一个动作）不同，混合策略引入了随机性，允许参与者在多个纯策略之间以特定概率进行随机化选择。形式上，对于一个策略集合公式，参与者

浏览 0 更新 2025-10-26

混合策略 (Mixed Strategy)

定义

混合策略（Mixed Strategy）是博弈论中的一个核心概念，指参与者在博弈中以某个概率分布随机选择其可用的纯策略（Pure Strategies）。与纯策略（即确定性地选择一个动作）不同，混合策略引入了随机性，允许参与者在多个纯策略之间以特定概率进行随机化选择。

形式上，对于一个策略集合 $S_i = \{s_{i1}, s_{i2}, \dots, s_{in}\}$ ，参与者 $i$ 的混合策略 $\sigma_i$ 是一个概率分布 $\sigma_i = (p_1, p_2, \dots, p_n)$ ，其中 $p_j \geq 0$ 且 $\sum_{j=1}^n p_j = 1$ ， $p_j$ 表示参与者 $i$ 选择纯策略 $s_{ij}$ 的概率。

混合策略均衡（Mixed Strategy Nash Equilibrium）

在纳什均衡中，每个参与者的策略必须是对其他参与者策略的最优反应。在混合策略纳什均衡中，每个参与者选择的混合策略使得对手的所有纯策略（以正概率被选择的纯策略）的期望收益相等。换句话说，参与者通过随机化使得对手没有动机偏离到某个纯策略。

混合策略纳什均衡的存在性由纳什定理（Nash, 1950）保证：任何有限博弈（参与者有限、策略有限）至少存在一个纳什均衡（可能包含混合策略）。

经典例子

1. 硬币匹配（Matching Pennies）

两名玩家各自选择正面或反面。若两人选择相同，玩家A赢；若选择不同，玩家B赢。这是一个零和博弈，没有纯策略纳什均衡，但存在唯一的混合策略纳什均衡：两名玩家各以 1/2 概率选择正面、1/2 概率选择反面。

计算过程：设玩家A以概率 $p$ 选正面，玩家B以概率 $q$ 选正面。玩家A的期望收益为 $pq \cdot 1 + p(1-q) \cdot (-1) + (1-p)q \cdot (-1) + (1-p)(1-q) \cdot 1 = (2p-1)(2q-1)$ 。要使玩家B无动机偏离，需使玩家A的收益独立于 $q$ ，即 $p = 1/2$ ；同理可得 $q = 1/2$ 。

2. 猎鹿博弈（Stag Hunt）

两名猎人可选择合作猎鹿或单独猎兔。猎鹿需两人合作，每人收益 2；猎兔单人可以完成，每人收益 1。该博弈有两个纯策略纳什均衡（都猎鹿、都猎兔）和一个混合策略纳什均衡。

3. 鹰鸽博弈（Hawk-Dove）

两名玩家争夺资源 $V$ ，战斗成本为 $C$ 。选择"鹰"（好斗）与"鸽"（和平）的配对不同收益不同。混合策略纳什均衡中，每个玩家以概率 $p = V/C$ 选择"鹰"（若 $V < C$ ）。

混合策略的解释

混合策略在经济学和社会学中有多种解释：

随机化行为：参与者在实际决策中确实进行随机化，如罚点球时的方向选择。
信念表征：混合策略不代表参与者真的随机化，而是表征其他参与者对某个参与者行为的不确定性。
群体频率：在大型群体中，混合策略可以解释为群体中选择某个纯策略的参与者比例。
策略性不确定性：混合策略是对手行为不确定性的数学描述。

混合策略的求解方法

求解混合策略纳什均衡的标准方法是利用无差异条件。在两人博弈中，设参与者1选择纯策略 $a_1, a_2, \dots, a_m$ 的概率分别为 $p_1, p_2, \dots, p_m$ ，参与者2选择纯策略 $b_1, b_2, \dots, b_n$ 的概率分别为 $q_1, q_2, \dots, q_n$ 。参与者1在均衡中必须对其支撑集中所有纯策略无差异：

\mathbb{E}[u_1(a_i, \sigma_2)] = \mathbb{E}[u_1(a_j, \sigma_2)], \quad \forall a_i, a_j \in \text{supp}(\sigma_1)

同样地，参与者2在其支撑集内也无差异。这一组方程加上概率和为1的条件，构成了求解混合策略均衡的线性方程组。

一个重要推论是：在混合策略纳什均衡中，参与者调整自己的混合概率并非为了使自己获得特定收益，而是为了使对手无差异。这一反直觉的结论是理解混合策略均衡的关键。

混合策略与纯策略的关系

混合策略与纯策略并非互斥关系。纯策略可以视为混合策略在概率退化为1时的特例。在策略空间中，混合策略构成了纯策略集合的凸包（Convex Hull）。某一混合策略的期望收益是各纯策略收益的加权平均。

混合策略纳什均衡的存在性比纯策略纳什均衡更广：并非所有博弈都有纯策略纳什均衡（如硬币匹配博弈），但每个有限博弈都有混合策略纳什均衡。这使得混合策略成为博弈论分析中的安全网。

混合策略的合理化

Harsanyi（1973）提出了一种重要的合理化思路。他认为，混合策略纳什均衡可以被解释为纯策略贝叶斯纳什均衡的极限情况。当参与者的收益存在微小扰动（即存在私人信息），且扰动的方差趋近于零时，贝叶斯纳什均衡的极限分布恰好对应于原来的混合策略纳什均衡。这一结论为混合策略提供了坚实的微观基础，使其不再仅仅是数学上的构造，而是具有信息经济学意义的现实行为描述。

混合策略的性质

无差异原理（Indifference Principle）：在混合策略纳什均衡中，参与者必须对其以正概率选择的所有纯策略无差异，即这些策略的期望收益相等。
支撑集（Support）：混合策略的支撑集指以正概率被选择的纯策略的集合。在均衡中，支撑集内的所有纯策略必须具有相同的期望收益，且不低于支撑集外的策略的期望收益。
退化情况：纯策略可以视为混合策略的特例（退化分布），即某个纯策略的概率为 1。

混合策略与扩展式博弈

在扩展式博弈（Extensive Form Games）中，混合策略与行为策略（Behavior Strategies）有所区别。行为策略在每个信息集（Information Set）上独立地定义概率分布。Kuhn定理（Kuhn, 1953）指出，在完美回忆（Perfect Recall）博弈中，每个混合策略等价于某个行为策略，反之亦然。

混合策略的应用

混合策略在以下领域有广泛应用：

产业组织：如随机定价、广告策略的不确定性
金融：交易策略中的随机化
军事与政治：威慑策略、核博弈中的相互确保摧毁
体育：罚球、发球等战术选择
进化博弈论（Evolutionary Game Theory）：进化稳定策略（ESS）中的混合策略

批评与局限

一些学者对混合策略纳什均衡的概念提出批评：

直觉性问题：在新古典经济学中，参与者通常被认为是理性的，而随机化行为与"理性选择"的直觉相悖。
多重均衡：混合策略均衡可能不是唯一的，且纯策略均衡往往更直观。
实际预测能力：实验室实验表明，人类参与者的行为往往偏离混合策略均衡的预测。
弱稳定性：混合策略均衡在进化博弈中往往是进化不稳定的，除非进行适当的改造。

尽管如此，混合策略仍然是博弈论中不可或缺的工具，提供了纯策略纳什均衡无法覆盖的重要理论洞见。

参考文献

Nash, J. (1950). "Equilibrium Points in n-Person Games." Proceedings of the National Academy of Sciences, 36(1), 48-49.
Kuhn, H. W. (1953). "Extensive Games and the Problem of Information." In Contributions to the Theory of Games, Vol. 2, 193-216.
Harsanyi, J. C. (1973). "Games with Randomly Disturbed Payoffs: A New Rationale for Mixed-Strategy Equilibrium Points." International Journal of Game Theory, 2(1), 1-23.
Osborne, M. J. \& Rubinstein, A. (1994). A Course in Game Theory. MIT Press.
Fudenberg, D. \& Tirole, J. (1991). Game Theory. MIT Press.

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。