ARTICLE

混合策略纳什均衡

混合策略纳什均衡 (Mixed Strategy Nash Equilibrium) 混合策略纳什均衡（Mixed Strategy Nash Equilibrium, MSNE）是博弈论中纳什均衡概念的重要扩展。在混合策略纳什均衡中，至少有一位参与者以固定概率分布随机选择其可行的纯策略。这种均衡的出现，通常是因为博弈不存在任何纯策略纳什均衡（PSNE），或

浏览 35 更新 2025-10-27

混合策略纳什均衡 (Mixed Strategy Nash Equilibrium)

混合策略纳什均衡（Mixed Strategy Nash Equilibrium, MSNE）是博弈论中纳什均衡概念的重要扩展。在混合策略纳什均衡中，至少有一位参与者以固定概率分布随机选择其可行的纯策略。这种均衡的出现，通常是因为博弈不存在任何纯策略纳什均衡（PSNE），或者为了解释参与者行为中的不确定性。

与混合策略相对的是纯策略——参与者在每个决策点以100\%的概率选择唯一确定的行动。纯策略纳什均衡是均衡概念的基础形式，而混合策略纳什均衡通过引入随机化选择，扩展了均衡的范畴，使得即使在纯策略下无法达成稳定状态的博弈中，参与者也能通过随机化达到一种无人愿意单方面偏离的均衡状态。混合策略纳什均衡在经济学、政治学、军事战略和演化生物学等领域都有广泛的应用。

核心思想：无差异原理

混合策略纳什均衡的构建基于一个关键逻辑前提——无差异原理（The Indifference Principle）。该原理指出：在一个混合策略纳什均衡中，如果某参与者正在以非零概率随机选择多个纯策略（即进行"混合"），那么对这些纯策略中的每一个，该参与者获得的期望效用必须完全相等。

这一原理的直观逻辑如下：若参与者A选择策略X的期望效用严格高于策略Y，那么理性的A不会再选择Y，而会以100\%的概率选择X，混合策略因此瓦解。因此，参与者愿意在多个策略间随机化的唯一理由，是对各策略的结果感到"无差异"（indifferent）。换言之，参与者的混合策略并非为了优化自身选择（因为他无差异），而是为了让对手无法预判其行动，从而迫使对手也在其纯策略之间达到无差异状态，阻止对手利用我方的确定性行为获取优势。无差异原理是求解混合策略纳什均衡的核心方法：通过令对手在某几个纯策略之间无差异，反推出己方的混合概率；再令己方无差异，反推出对手的混合概率。

经典示例：硬币匹配博弈

硬币匹配博弈（Matching Pennies）是阐释混合策略纳什均衡最经典的零和博弈。设定如下：两名参与者同时出示硬币正面（H）或反面（T）。面相同则参与者1赢1元，面不同则参与者2赢1元，收益矩阵如下：

\begin{array}{c|cc} & \text{正面 (H)} & \text{反面 (T)} \\ \hline \text{正面 (H)} & (1, -1) & (-1, 1) \\ \text{反面 (T)} & (-1, 1) & (1, -1) \end{array}

该博弈不存在纯策略纳什均衡——任一纯策略组合中至少有一方有动机单方面偏离。因此需寻找混合策略纳什均衡。

令参与者1以概率 $p$ 选H、 $1-p$ 选T。为使参与者2无差异，计算其期望效用： $E_2(H) = p \cdot (-1) + (1-p) \cdot 1 = 1 - 2p$ ； $E_2(T) = p \cdot 1 + (1-p) \cdot (-1) = 2p - 1$ 。令 $E_2(H) = E_2(T)$ 得 $1 - 2p = 2p - 1$ ，解得 $p = 1/2$ 。

同理，令参与者2以概率 $q$ 选H、 $1-q$ 选T，由参与者1无差异条件解得 $q = 1/2$ 。因此该博弈唯一的混合策略纳什均衡为：双方均以50\%概率随机选择正面或反面。在此均衡下，任何一方单方面改变混合概率都无法获得更高期望效用。例如，若参与者1将出正面的概率提高至3/4，参与者2的最优反应将是100\%选择反面，导致参与者1的期望效用从0降至-1/2，可见偏离均衡是不明智的。

混合策略的多种解释

混合策略中的"随机化"在学术文献中有不同层面的解释。其一是有意识的随机化——参与者像掷硬币一样有意识地在各策略间随机选择，例如足球点球中的发球方向、网球发球中的落点选择等，运动员通过随机化防止对手预判。其二是信念表达——混合策略并非实际随机行为，而是代表了对手对该参与者行为不确定性的主观信念。其三是在演化博弈论中，混合策略可被解释为群体中采取不同纯策略的个体所占的比例。此外，豪尔绍尼的纯化定理指出，混合策略纳什均衡可被视为不完全信息博弈中纯策略贝叶斯纳什均衡的极限情形，为混合策略提供了更深层次的理性基础。

存在性与理论意义

混合策略纳什均衡最重要的理论贡献，在于保证了均衡的存在性。根据约翰·纳什证明的纳什均衡存在性定理：任何具有有限参与者数量和有限纯策略的有限博弈都至少存在一个纳什均衡（纯策略或混合策略）。该定理是现代博弈论的基石，确保了无论博弈结构如何，总能找到一个稳定且可预测的均衡结果。混合策略纳什均衡在经济学、政治科学、生物学和计算机科学等领域均有广泛应用。在经济学中，产业组织理论使用混合策略解释企业的随机定价行为；在政治学中，选举模型用混合策略刻画候选人的政策定位不确定性；在生物学中，演化博弈论通过混合策略解释种群中不同行为策略的稳定共存。混合策略纳什均衡为理解策略互动中的不确定性和随机化行为提供了严谨的分析框架，是现代博弈论不可或缺的组成部分。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。