ARTICLE
纯策略纳什均衡
纯策略纳什均衡 (Pure Strategy Nash Equilibrium) 纯策略纳什均衡(Pure Strategy Nash Equilibrium, PSNE)是博弈论(Game Theory)中描述静态博弈稳定状态的核心概念。它指一个策略组合,其中没有任何参与者(player)能通过单方面改变自身策略获得更高收益(Payoff),前提是其他参与
纯策略纳什均衡 (Pure Strategy Nash Equilibrium)
纯策略纳什均衡(Pure Strategy Nash Equilibrium, PSNE)是博弈论(Game Theory)中描述静态博弈稳定状态的核心概念。它指一个策略组合,其中没有任何参与者(player)能通过单方面改变自身策略获得更高收益(Payoff),前提是其他参与者的策略保持不变。该概念由数学家约翰·纳什(John Nash)于1950年在其博士论文中正式提出和证明,发表于1951年的《美国数学年鉴》。纳什凭借这项开创性工作与约翰·海萨尼、莱因哈德·泽尔腾共同获得1994年诺贝尔经济学奖。PSNE的核心思想可概括为"无悔"——当博弈结果揭晓后,每个参与者回顾自己的决策时,都会发现给定他人选择的情况下自己的选择是最优的。
为准确理解这一概念,需区分纯策略与混合策略(Mixed Strategy)。纯策略是确定性行动方案,为参与者在每个决策点上指定唯一确定的行动,不涉及随机性,例如"石头-剪刀-布"中"一直出石头";混合策略则为每个可能的纯策略赋予一个选择概率,允许以不确定性方式行动。纯策略纳什均衡即所有参与者均采用纯策略时所构成的纳什均衡,而混合策略纳什均衡涉及概率化选择。
形式化定义
在包含 个参与者的博弈中,令 为参与者 的纯策略集合,策略组合 其中 , 为参与者 在策略组合 下的收益。策略组合 是纯策略纳什均衡,当且仅当对每个参与者 及其任何其他纯策略 ,满足以下不等式:
该不等式意味着在均衡状态下,任何参与者都无法通过单方面偏离到其他纯策略来改善自身收益。此时称 是对其他参与者策略组合 的一个最佳应对(Best Response)。因此,PSNE的本质是所有参与者的策略互为最佳应对的策略组合。求解PSNE的基本方法包括划线法(逐一检查每个参与者对每个对手策略组合的最佳应对,标记对应的收益,最后寻找所有收益均被标记的单元格)和逐次剔除劣势策略(Iterated Elimination of Strictly Dominated Strategies)。在连续策略空间的博弈中,则通过求解反应函数(Reaction Function)方程组来获得均衡点。
经典案例
囚徒困境(Prisoner's Dilemma)是展示纳什均衡与全局最优之间差异的经典案例。两个嫌疑人被分开关押,面临"坦白"(Confess)或"沉默"(Silent)的选择,收益(以服刑年限负值表示)如下:
从嫌疑人A视角:若B坦白,A最优选坦白(-8 > -10);若B沉默,A仍选坦白(0 > -1)。坦白是A的优势策略(Dominant Strategy)。对称地,坦白也是B的优势策略。因此(坦白, 坦白)是唯一的PSNE。值得注意的是,该结果并非帕累托最优(Pareto Optimal)——(沉默, 沉默)的收益(-1, -1)对双方更优,但这不是均衡,因为任何一方都有动机单方面偏离到坦白(从-1提升至0)。囚徒困境揭示了个人理性与集体理性之间的矛盾,在经济学中被广泛应用于解释寡头垄断中的价格战、公共品供给不足等问题。
性别之战(Battle of the Sexes)展示了多个PSNE同时存在的问题。一对情侣选择共同活动:男方偏好看球赛,女方偏好看歌剧,但双方都更看重与对方在一起:
若女方选球赛,男方最佳应对是球赛(2 > 0);若男方选球赛,女方最佳应对是球赛(1 > 0),故(球赛, 球赛)是PSNE。类似地,(歌剧, 歌剧)也是PSNE。这个协调博弈(Coordination Game)有两个PSNE,引出了均衡选择问题——实际出现哪个均衡可能取决于文化习惯、焦点效应(Focal Point)或事先沟通。协调博弈在制度经济学中用于解释社会惯例的形成与演化。
古诺双寡头模型(Cournot Duopoly)展示了连续策略空间中的PSNE。两企业同时选择产量 ,市场价格由总产量 决定。通过对利润函数求一阶偏导并联立求解反应函数,可得均衡产量 ,该均衡点恰为两条反应函数的交点,每家企业在此处的产量均构成对其他企业产量的最佳应对,任何单方面增减产量都会降低自身利润。
存在性定理
并非所有博弈都存在PSNE。硬币正反博弈(Matching Pennies)是典型例子。参与者同时出示硬币正反面:相同则参与者1赢得1元,不同则参与者2赢得1元:
逐项检验:(H,H)中参与者2有动机改T;(H,T)中参与者1有动机改T;(T,H)中参与者1有动机改H;(T,T)中参与者2有动机改H——不存在任何PSNE。此类零和博弈虽无纯策略均衡,但存在混合策略纳什均衡,即参与者以特定概率随机化行动以保持对手无法预测。纳什存在性定理(Nash Existence Theorem)保证了在任何有限博弈(有限参与者、有限策略集)中,至少存在一个纳什均衡(纯策略或混合策略)。该定理的证明依赖于布劳威尔不动点定理(Brouwer Fixed Point Theorem)或角谷静夫不动点定理,是博弈论最深刻的理论基石之一。
应用与意义
PSNE在经济学中应用广泛。在产业组织理论中,古诺模型和伯特兰模型分别以产量和价格为决策变量,其均衡结果揭示了市场结构对企业行为的影响。在拍卖理论中,投标人同时提交出价构成一个策略博弈,维克里拍卖(第二价格密封拍卖)中按真实估价出价构成优势策略均衡。在公共经济学中,搭便车问题可建模为囚徒困境型博弈,揭示公共品私人供给不足的逻辑。在社会规范研究中,协调博弈的PSNE解释了为什么某种规范一旦形成便具有自我实施的性质——如靠右行驶的交通规则,无人有单方面偏离的动机。
此外,PSNE是理解更复杂均衡概念的基础:贝叶斯纳什均衡处理不完全信息情形,子博弈完美均衡处理动态博弈中的承诺问题,精炼贝叶斯均衡结合两者。这些较复杂的均衡概念均以PSNE的思想为出发点,将"无人能通过单方面偏离获益"这一核心逻辑推广到更丰富的策略环境。因此,扎实掌握纯策略纳什均衡的条件、求解方法和局限性,是深入学习现代博弈论及相关经济学科的必要起点。