ARTICLE

混合策略纳什均衡

混合策略纳什均衡 (Mixed Strategy Nash Equilibrium) 混合策略纳什均衡(Mixed Strategy Nash Equilibrium, MSNE)是博弈论中纳什均衡概念的重要扩展。在混合策略纳什均衡中,至少有一位参与者以固定概率分布随机选择其可行的纯策略。这种均衡的出现,通常是因为博弈不存在任何纯策略纳什均衡(PSNE),或

浏览 35 更新 2025-10-27

混合策略纳什均衡 (Mixed Strategy Nash Equilibrium)

混合策略纳什均衡(Mixed Strategy Nash Equilibrium, MSNE)是博弈论纳什均衡概念的重要扩展。在混合策略纳什均衡中,至少有一位参与者以固定概率分布随机选择其可行的纯策略。这种均衡的出现,通常是因为博弈不存在任何纯策略纳什均衡(PSNE),或者为了解释参与者行为中的不确定性。

与混合策略相对的是纯策略——参与者在每个决策点以100\%的概率选择唯一确定的行动。纯策略纳什均衡是均衡概念的基础形式,而混合策略纳什均衡通过引入随机化选择,扩展了均衡的范畴,使得即使在纯策略下无法达成稳定状态的博弈中,参与者也能通过随机化达到一种无人愿意单方面偏离的均衡状态。混合策略纳什均衡在经济学、政治学、军事战略和演化生物学等领域都有广泛的应用。

核心思想:无差异原理

混合策略纳什均衡的构建基于一个关键逻辑前提——无差异原理(The Indifference Principle)。该原理指出:在一个混合策略纳什均衡中,如果某参与者正在以非零概率随机选择多个纯策略(即进行"混合"),那么对这些纯策略中的每一个,该参与者获得的期望效用必须完全相等。

这一原理的直观逻辑如下:若参与者A选择策略X的期望效用严格高于策略Y,那么理性的A不会再选择Y,而会以100\%的概率选择X,混合策略因此瓦解。因此,参与者愿意在多个策略间随机化的唯一理由,是对各策略的结果感到"无差异"(indifferent)。换言之,参与者的混合策略并非为了优化自身选择(因为他无差异),而是为了让对手无法预判其行动,从而迫使对手也在其纯策略之间达到无差异状态,阻止对手利用我方的确定性行为获取优势。无差异原理是求解混合策略纳什均衡的核心方法:通过令对手在某几个纯策略之间无差异,反推出己方的混合概率;再令己方无差异,反推出对手的混合概率。

经典示例:硬币匹配博弈

硬币匹配博弈(Matching Pennies)是阐释混合策略纳什均衡最经典的零和博弈。设定如下:两名参与者同时出示硬币正面(H)或反面(T)。面相同则参与者1赢1元,面不同则参与者2赢1元,收益矩阵如下:

正面 (H)反面 (T)正面 (H)(1,1)(1,1)反面 (T)(1,1)(1,1)\begin{array}{c|cc} & \text{正面 (H)} & \text{反面 (T)} \\ \hline \text{正面 (H)} & (1, -1) & (-1, 1) \\ \text{反面 (T)} & (-1, 1) & (1, -1) \end{array}

该博弈不存在纯策略纳什均衡——任一纯策略组合中至少有一方有动机单方面偏离。因此需寻找混合策略纳什均衡。

令参与者1以概率 pp 选H、1p1-p 选T。为使参与者2无差异,计算其期望效用:E2(H)=p(1)+(1p)1=12pE_2(H) = p \cdot (-1) + (1-p) \cdot 1 = 1 - 2pE2(T)=p1+(1p)(1)=2p1E_2(T) = p \cdot 1 + (1-p) \cdot (-1) = 2p - 1。令 E2(H)=E2(T)E_2(H) = E_2(T)12p=2p11 - 2p = 2p - 1,解得 p=1/2p = 1/2

同理,令参与者2以概率 qq 选H、1q1-q 选T,由参与者1无差异条件解得 q=1/2q = 1/2。因此该博弈唯一的混合策略纳什均衡为:双方均以50\%概率随机选择正面或反面。在此均衡下,任何一方单方面改变混合概率都无法获得更高期望效用。例如,若参与者1将出正面的概率提高至3/4,参与者2的最优反应将是100\%选择反面,导致参与者1的期望效用从0降至-1/2,可见偏离均衡是不明智的。

混合策略的多种解释

混合策略中的"随机化"在学术文献中有不同层面的解释。其一是有意识的随机化——参与者像掷硬币一样有意识地在各策略间随机选择,例如足球点球中的发球方向、网球发球中的落点选择等,运动员通过随机化防止对手预判。其二是信念表达——混合策略并非实际随机行为,而是代表了对手对该参与者行为不确定性的主观信念。其三是在演化博弈论中,混合策略可被解释为群体中采取不同纯策略的个体所占的比例。此外,豪尔绍尼纯化定理指出,混合策略纳什均衡可被视为不完全信息博弈中纯策略贝叶斯纳什均衡的极限情形,为混合策略提供了更深层次的理性基础。

存在性与理论意义

混合策略纳什均衡最重要的理论贡献,在于保证了均衡的存在性。根据约翰·纳什证明的纳什均衡存在性定理:任何具有有限参与者数量和有限纯策略的有限博弈都至少存在一个纳什均衡(纯策略或混合策略)。该定理是现代博弈论的基石,确保了无论博弈结构如何,总能找到一个稳定且可预测的均衡结果。混合策略纳什均衡在经济学政治科学生物学计算机科学等领域均有广泛应用。在经济学中,产业组织理论使用混合策略解释企业的随机定价行为;在政治学中,选举模型用混合策略刻画候选人的政策定位不确定性;在生物学中,演化博弈论通过混合策略解释种群中不同行为策略的稳定共存。混合策略纳什均衡为理解策略互动中的不确定性和随机化行为提供了严谨的分析框架,是现代博弈论不可或缺的组成部分。