ARTICLE

纯策略纳什均衡

纯策略纳什均衡 (Pure Strategy Nash Equilibrium) 纯策略纳什均衡(Pure Strategy Nash Equilibrium, PSNE)是博弈论(Game Theory)中描述静态博弈稳定状态的核心概念。它指一个策略组合,其中没有任何参与者(player)能通过单方面改变自身策略获得更高收益(Payoff),前提是其他参与

浏览 31 更新 2025-10-26

纯策略纳什均衡 (Pure Strategy Nash Equilibrium)

纯策略纳什均衡(Pure Strategy Nash Equilibrium, PSNE)是博弈论(Game Theory)中描述静态博弈稳定状态的核心概念。它指一个策略组合,其中没有任何参与者(player)能通过单方面改变自身策略获得更高收益(Payoff),前提是其他参与者的策略保持不变。该概念由数学家约翰·纳什(John Nash)于1950年在其博士论文中正式提出和证明,发表于1951年的《美国数学年鉴》。纳什凭借这项开创性工作与约翰·海萨尼、莱因哈德·泽尔腾共同获得1994年诺贝尔经济学奖。PSNE的核心思想可概括为"无悔"——当博弈结果揭晓后,每个参与者回顾自己的决策时,都会发现给定他人选择的情况下自己的选择是最优的。

为准确理解这一概念,需区分纯策略混合策略(Mixed Strategy)。纯策略是确定性行动方案,为参与者在每个决策点上指定唯一确定的行动,不涉及随机性,例如"石头-剪刀-布"中"一直出石头";混合策略则为每个可能的纯策略赋予一个选择概率,允许以不确定性方式行动。纯策略纳什均衡即所有参与者均采用纯策略时所构成的纳什均衡,而混合策略纳什均衡涉及概率化选择。

形式化定义

在包含 nn 个参与者的博弈中,令 SiS_i 为参与者 ii 的纯策略集合,策略组合 s=(s1,s2,,sn)s = (s_1, s_2, \ldots, s_n) 其中 siSis_i \in S_iui(s)u_i(s) 为参与者 ii 在策略组合 ss 下的收益。策略组合 s=(s1,s2,,sn)s^* = (s_1^*, s_2^*, \ldots, s_n^*) 是纯策略纳什均衡,当且仅当对每个参与者 i{1,2,,n}i \in \{1, 2, \ldots, n\} 及其任何其他纯策略 siSis_i \in S_i,满足以下不等式:

ui(s1,,si,,sn)ui(s1,,si,,sn)u_i(s_1^*, \ldots, s_i^*, \ldots, s_n^*) \ge u_i(s_1^*, \ldots, s_i, \ldots, s_n^*)

该不等式意味着在均衡状态下,任何参与者都无法通过单方面偏离到其他纯策略来改善自身收益。此时称 sis_i^* 是对其他参与者策略组合 (s1,,si1,si+1,,sn)(s_1^*, \ldots, s_{i-1}^*, s_{i+1}^*, \ldots, s_n^*) 的一个最佳应对(Best Response)。因此,PSNE的本质是所有参与者的策略互为最佳应对的策略组合。求解PSNE的基本方法包括划线法(逐一检查每个参与者对每个对手策略组合的最佳应对,标记对应的收益,最后寻找所有收益均被标记的单元格)和逐次剔除劣势策略(Iterated Elimination of Strictly Dominated Strategies)。在连续策略空间的博弈中,则通过求解反应函数(Reaction Function)方程组来获得均衡点。

经典案例

囚徒困境(Prisoner's Dilemma)是展示纳什均衡与全局最优之间差异的经典案例。两个嫌疑人被分开关押,面临"坦白"(Confess)或"沉默"(Silent)的选择,收益(以服刑年限负值表示)如下:

坦白沉默坦白(8,8)(0,10)沉默(10,0)(1,1)\begin{array}{c|cc} & \text{坦白} & \text{沉默} \\ \hline \text{坦白} & (-8, -8) & (0, -10) \\ \text{沉默} & (-10, 0) & (-1, -1) \end{array}

从嫌疑人A视角:若B坦白,A最优选坦白(-8 > -10);若B沉默,A仍选坦白(0 > -1)。坦白是A的优势策略(Dominant Strategy)。对称地,坦白也是B的优势策略。因此(坦白, 坦白)是唯一的PSNE。值得注意的是,该结果并非帕累托最优(Pareto Optimal)——(沉默, 沉默)的收益(-1, -1)对双方更优,但这不是均衡,因为任何一方都有动机单方面偏离到坦白(从-1提升至0)。囚徒困境揭示了个人理性与集体理性之间的矛盾,在经济学中被广泛应用于解释寡头垄断中的价格战、公共品供给不足等问题。

性别之战(Battle of the Sexes)展示了多个PSNE同时存在的问题。一对情侣选择共同活动:男方偏好看球赛,女方偏好看歌剧,但双方都更看重与对方在一起:

球赛歌剧球赛(1,2)(0,0)歌剧(0,0)(2,1)\begin{array}{c|cc} & \text{球赛} & \text{歌剧} \\ \hline \text{球赛} & (1, 2) & (0, 0) \\ \text{歌剧} & (0, 0) & (2, 1) \end{array}

若女方选球赛,男方最佳应对是球赛(2 > 0);若男方选球赛,女方最佳应对是球赛(1 > 0),故(球赛, 球赛)是PSNE。类似地,(歌剧, 歌剧)也是PSNE。这个协调博弈(Coordination Game)有两个PSNE,引出了均衡选择问题——实际出现哪个均衡可能取决于文化习惯、焦点效应(Focal Point)或事先沟通。协调博弈在制度经济学中用于解释社会惯例的形成与演化。

古诺双寡头模型(Cournot Duopoly)展示了连续策略空间中的PSNE。两企业同时选择产量 q1,q2q_1, q_2,市场价格由总产量 Q=q1+q2Q = q_1 + q_2 决定。通过对利润函数求一阶偏导并联立求解反应函数,可得均衡产量 (q1,q2)(q_1^*, q_2^*),该均衡点恰为两条反应函数的交点,每家企业在此处的产量均构成对其他企业产量的最佳应对,任何单方面增减产量都会降低自身利润。

存在性定理

并非所有博弈都存在PSNE。硬币正反博弈(Matching Pennies)是典型例子。参与者同时出示硬币正反面:相同则参与者1赢得1元,不同则参与者2赢得1元:

正面反面正面(+1,1)(1,+1)反面(1,+1)(+1,1)\begin{array}{c|cc} & \text{正面} & \text{反面} \\ \hline \text{正面} & (+1, -1) & (-1, +1) \\ \text{反面} & (-1, +1) & (+1, -1) \end{array}

逐项检验:(H,H)中参与者2有动机改T;(H,T)中参与者1有动机改T;(T,H)中参与者1有动机改H;(T,T)中参与者2有动机改H——不存在任何PSNE。此类零和博弈虽无纯策略均衡,但存在混合策略纳什均衡,即参与者以特定概率随机化行动以保持对手无法预测。纳什存在性定理(Nash Existence Theorem)保证了在任何有限博弈(有限参与者、有限策略集)中,至少存在一个纳什均衡(纯策略或混合策略)。该定理的证明依赖于布劳威尔不动点定理(Brouwer Fixed Point Theorem)或角谷静夫不动点定理,是博弈论最深刻的理论基石之一。

应用与意义

PSNE在经济学中应用广泛。在产业组织理论中,古诺模型伯特兰模型分别以产量和价格为决策变量,其均衡结果揭示了市场结构对企业行为的影响。在拍卖理论中,投标人同时提交出价构成一个策略博弈,维克里拍卖(第二价格密封拍卖)中按真实估价出价构成优势策略均衡。在公共经济学中,搭便车问题可建模为囚徒困境型博弈,揭示公共品私人供给不足的逻辑。在社会规范研究中,协调博弈的PSNE解释了为什么某种规范一旦形成便具有自我实施的性质——如靠右行驶的交通规则,无人有单方面偏离的动机。

此外,PSNE是理解更复杂均衡概念的基础:贝叶斯纳什均衡处理不完全信息情形,子博弈完美均衡处理动态博弈中的承诺问题,精炼贝叶斯均衡结合两者。这些较复杂的均衡概念均以PSNE的思想为出发点,将"无人能通过单方面偏离获益"这一核心逻辑推广到更丰富的策略环境。因此,扎实掌握纯策略纳什均衡的条件、求解方法和局限性,是深入学习现代博弈论及相关经济学科的必要起点。