ARTICLE

纯策略纳什均衡

纯策略纳什均衡 (Pure Strategy Nash Equilibrium) 纯策略纳什均衡（Pure Strategy Nash Equilibrium, PSNE）是博弈论（Game Theory）中描述静态博弈稳定状态的核心概念。它指一个策略组合，其中没有任何参与者（player）能通过单方面改变自身策略获得更高收益（Payoff），前提是其他参与

浏览 31 更新 2025-10-26

纯策略纳什均衡 (Pure Strategy Nash Equilibrium)

纯策略纳什均衡（Pure Strategy Nash Equilibrium, PSNE）是博弈论（Game Theory）中描述静态博弈稳定状态的核心概念。它指一个策略组合，其中没有任何参与者（player）能通过单方面改变自身策略获得更高收益（Payoff），前提是其他参与者的策略保持不变。该概念由数学家约翰·纳什（John Nash）于1950年在其博士论文中正式提出和证明，发表于1951年的《美国数学年鉴》。纳什凭借这项开创性工作与约翰·海萨尼、莱因哈德·泽尔腾共同获得1994年诺贝尔经济学奖。PSNE的核心思想可概括为"无悔"——当博弈结果揭晓后，每个参与者回顾自己的决策时，都会发现给定他人选择的情况下自己的选择是最优的。

为准确理解这一概念，需区分纯策略与混合策略（Mixed Strategy）。纯策略是确定性行动方案，为参与者在每个决策点上指定唯一确定的行动，不涉及随机性，例如"石头-剪刀-布"中"一直出石头"；混合策略则为每个可能的纯策略赋予一个选择概率，允许以不确定性方式行动。纯策略纳什均衡即所有参与者均采用纯策略时所构成的纳什均衡，而混合策略纳什均衡涉及概率化选择。

形式化定义

在包含 $n$ 个参与者的博弈中，令 $S_i$ 为参与者 $i$ 的纯策略集合，策略组合 $s = (s_1, s_2, \ldots, s_n)$ 其中 $s_i \in S_i$ ， $u_i(s)$ 为参与者 $i$ 在策略组合 $s$ 下的收益。策略组合 $s^* = (s_1^*, s_2^*, \ldots, s_n^*)$ 是纯策略纳什均衡，当且仅当对每个参与者 $i \in \{1, 2, \ldots, n\}$ 及其任何其他纯策略 $s_i \in S_i$ ，满足以下不等式：

u_i(s_1^*, \ldots, s_i^*, \ldots, s_n^*) \ge u_i(s_1^*, \ldots, s_i, \ldots, s_n^*)

该不等式意味着在均衡状态下，任何参与者都无法通过单方面偏离到其他纯策略来改善自身收益。此时称 $s_i^*$ 是对其他参与者策略组合 $(s_1^*, \ldots, s_{i-1}^*, s_{i+1}^*, \ldots, s_n^*)$ 的一个最佳应对（Best Response）。因此，PSNE的本质是所有参与者的策略互为最佳应对的策略组合。求解PSNE的基本方法包括划线法（逐一检查每个参与者对每个对手策略组合的最佳应对，标记对应的收益，最后寻找所有收益均被标记的单元格）和逐次剔除劣势策略（Iterated Elimination of Strictly Dominated Strategies）。在连续策略空间的博弈中，则通过求解反应函数（Reaction Function）方程组来获得均衡点。

经典案例

囚徒困境（Prisoner's Dilemma）是展示纳什均衡与全局最优之间差异的经典案例。两个嫌疑人被分开关押，面临"坦白"（Confess）或"沉默"（Silent）的选择，收益（以服刑年限负值表示）如下：

\begin{array}{c|cc} & \text{坦白} & \text{沉默} \\ \hline \text{坦白} & (-8, -8) & (0, -10) \\ \text{沉默} & (-10, 0) & (-1, -1) \end{array}

从嫌疑人A视角：若B坦白，A最优选坦白（-8 > -10）；若B沉默，A仍选坦白（0 > -1）。坦白是A的优势策略（Dominant Strategy）。对称地，坦白也是B的优势策略。因此（坦白, 坦白）是唯一的PSNE。值得注意的是，该结果并非帕累托最优（Pareto Optimal）——（沉默, 沉默）的收益（-1, -1）对双方更优，但这不是均衡，因为任何一方都有动机单方面偏离到坦白（从-1提升至0）。囚徒困境揭示了个人理性与集体理性之间的矛盾，在经济学中被广泛应用于解释寡头垄断中的价格战、公共品供给不足等问题。

性别之战（Battle of the Sexes）展示了多个PSNE同时存在的问题。一对情侣选择共同活动：男方偏好看球赛，女方偏好看歌剧，但双方都更看重与对方在一起：

\begin{array}{c|cc} & \text{球赛} & \text{歌剧} \\ \hline \text{球赛} & (1, 2) & (0, 0) \\ \text{歌剧} & (0, 0) & (2, 1) \end{array}

若女方选球赛，男方最佳应对是球赛（2 > 0）；若男方选球赛，女方最佳应对是球赛（1 > 0），故（球赛, 球赛）是PSNE。类似地，（歌剧, 歌剧）也是PSNE。这个协调博弈（Coordination Game）有两个PSNE，引出了均衡选择问题——实际出现哪个均衡可能取决于文化习惯、焦点效应（Focal Point）或事先沟通。协调博弈在制度经济学中用于解释社会惯例的形成与演化。

古诺双寡头模型（Cournot Duopoly）展示了连续策略空间中的PSNE。两企业同时选择产量 $q_1, q_2$ ，市场价格由总产量 $Q = q_1 + q_2$ 决定。通过对利润函数求一阶偏导并联立求解反应函数，可得均衡产量 $(q_1^*, q_2^*)$ ，该均衡点恰为两条反应函数的交点，每家企业在此处的产量均构成对其他企业产量的最佳应对，任何单方面增减产量都会降低自身利润。

存在性定理

并非所有博弈都存在PSNE。硬币正反博弈（Matching Pennies）是典型例子。参与者同时出示硬币正反面：相同则参与者1赢得1元，不同则参与者2赢得1元：

\begin{array}{c|cc} & \text{正面} & \text{反面} \\ \hline \text{正面} & (+1, -1) & (-1, +1) \\ \text{反面} & (-1, +1) & (+1, -1) \end{array}

逐项检验：(H,H)中参与者2有动机改T；(H,T)中参与者1有动机改T；(T,H)中参与者1有动机改H；(T,T)中参与者2有动机改H——不存在任何PSNE。此类零和博弈虽无纯策略均衡，但存在混合策略纳什均衡，即参与者以特定概率随机化行动以保持对手无法预测。纳什存在性定理（Nash Existence Theorem）保证了在任何有限博弈（有限参与者、有限策略集）中，至少存在一个纳什均衡（纯策略或混合策略）。该定理的证明依赖于布劳威尔不动点定理（Brouwer Fixed Point Theorem）或角谷静夫不动点定理，是博弈论最深刻的理论基石之一。

应用与意义

PSNE在经济学中应用广泛。在产业组织理论中，古诺模型和伯特兰模型分别以产量和价格为决策变量，其均衡结果揭示了市场结构对企业行为的影响。在拍卖理论中，投标人同时提交出价构成一个策略博弈，维克里拍卖（第二价格密封拍卖）中按真实估价出价构成优势策略均衡。在公共经济学中，搭便车问题可建模为囚徒困境型博弈，揭示公共品私人供给不足的逻辑。在社会规范研究中，协调博弈的PSNE解释了为什么某种规范一旦形成便具有自我实施的性质——如靠右行驶的交通规则，无人有单方面偏离的动机。

此外，PSNE是理解更复杂均衡概念的基础：贝叶斯纳什均衡处理不完全信息情形，子博弈完美均衡处理动态博弈中的承诺问题，精炼贝叶斯均衡结合两者。这些较复杂的均衡概念均以PSNE的思想为出发点，将"无人能通过单方面偏离获益"这一核心逻辑推广到更丰富的策略环境。因此，扎实掌握纯策略纳什均衡的条件、求解方法和局限性，是深入学习现代博弈论及相关经济学科的必要起点。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。