ARTICLE

纳什均衡 (Nash Equilibrium)

纳什均衡 (Nash Equilibrium) 纳什均衡(Nash Equilibrium)是博弈论中最核心的解概念,由美国数学家约翰·纳什(John Nash)于1950-1951年的两篇论文中提出并证明其存在性。纳什均衡描述的是这样一种策略组合状态:在给定其他参与者策略不变的前提下,没有任何一个参与者可以通过单方面偏离当前策略而获得更高的收益。这一概念将

浏览 0 更新 2025-10-26

纳什均衡 (Nash Equilibrium)

纳什均衡(Nash Equilibrium)是博弈论中最核心的解概念,由美国数学家约翰·纳什(John Nash)于1950-1951年的两篇论文中提出并证明其存在性。纳什均衡描述的是这样一种策略组合状态:在给定其他参与者策略不变的前提下,没有任何一个参与者可以通过单方面偏离当前策略而获得更高的收益。这一概念将博弈论的分析范围从零和博弈扩展至任意有限人数的非合作博弈,从根本上重塑了现代经济学的理论范式。纳什因其在非合作博弈均衡理论上的开创性贡献,与约翰·豪尔绍尼莱因哈德·泽尔腾共同获得1994年诺贝尔经济学奖。

形式化定义

设一个包含 nn 个参与者的博弈,参与者集合为 N={1,2,,n}\mathcal{N} = \{1, 2, \ldots, n\}。每位参与者 ii 拥有策略空间 SiS_i(纯策略集合)和收益函数 ui:SRu_i: S \to \mathbb{R},其中 S=S1×S2××SnS = S_1 \times S_2 \times \cdots \times S_n 为所有策略组合的空间。一个策略组合 s=(s1,s2,,sn)s^* = (s_1^*, s_2^*, \ldots, s_n^*) 构成纯策略纳什均衡,当且仅当:

ui(si,si)ui(si,si),siSi,  iNu_i(s_i^*, s_{-i}^*) \ge u_i(s_i, s_{-i}^*), \quad \forall s_i \in S_i, \; \forall i \in \mathcal{N}

其中 sis_{-i}^* 表示除参与者 ii 外其余参与者按均衡策略行动。该条件意味着每个参与者的均衡策略均是对他人策略的最优反应(Best Response),均衡因此是一个互为最优反应的策略组合的不动点

若允许参与者将纯策略随机化,则引入混合策略的概念。参与者 ii 的一个混合策略 σi\sigma_i 是其纯策略空间 SiS_i 上的一个概率分布。混合策略组合 σ=(σ1,,σn)\sigma^* = (\sigma_1^*, \ldots, \sigma_n^*) 构成混合策略纳什均衡,当且仅当:

E[ui(σi,σi)]E[ui(σi,σi)],σiΔ(Si),  iN\mathbb{E}[u_i(\sigma_i^*, \sigma_{-i}^*)] \ge \mathbb{E}[u_i(\sigma_i, \sigma_{-i}^*)], \quad \forall \sigma_i \in \Delta(S_i), \; \forall i \in \mathcal{N}

其中 Δ(Si)\Delta(S_i)SiS_i 上的概率单纯形,期望针对策略随机化产生的分布求取。

存在性定理

纳什(1950)证明了博弈论中最根本的存在性结果:任何有限博弈(参与者有限、每个参与者的纯策略有限)至少存在一个纳什均衡,该均衡可以是纯策略或混合策略。证明基于角谷不动点定理(Kakutani Fixed Point Theorem)——将最优反应对应构造为从策略单纯形到自身的一个上半连续且凸值的映射,因策略单纯形为非空紧凸集,角谷不动点定理保证该映射存在不动点,此不动点即为纳什均衡。

纯策略均衡不一定存在——经典的Matching Pennies博弈便无纯策略均衡,但其唯一的混合策略均衡为双方各以 1/21/2 概率选择正反面。德布鲁(Debreu, 1952)、格里克斯伯格(Glicksberg, 1952)和范晓(Fan, 1952)将存在性推广至连续策略空间,借助更为复杂的不动点技术完成证明。

经典范例

囚徒困境

囚徒困境是最著名的非零和博弈典范:两名嫌疑人分别受审,若双方均沉默(合作),各判1年;一方坦白而对方沉默,坦白者获释、沉默者判10年;双方均坦白,各判5年。在该博弈中,无论对手如何选择,坦白都是个体的严格优势策略,因此唯一的纳什均衡是(坦白,坦白)。此均衡并非帕累托最优——双方合作可带来更好的集体结果,深刻揭示了个体理性与集体理性的冲突。

性别战

性别战(Battle of the Sexes)是典型的协调博弈:一对伴侣希望共度夜晚,男方偏好拳击赛,女方偏好歌剧,但双方宁愿在一起也不愿各自分开。该博弈存在两个纯策略纳什均衡——(拳击,拳击)和(歌剧,歌剧)——以及一个混合策略均衡。核心问题不是激励冲突,而是预期协调。谢林提出的聚点(Focal Point)概念正是为解决此类多重均衡中的协调问题。

古诺双寡头

古诺竞争是纳什均衡在产业组织领域的经典应用。两家企业同时选择产量 q1,q2q_1, q_2,市场价格由总产量决定:P(Q)=abQP(Q) = a - bQ,其中 Q=q1+q2Q = q_1 + q_2。企业 ii 的利润为 πi=(P(Q)c)qi\pi_i = (P(Q) - c) q_i。对利润函数求一阶条件,可得最优反应函数:

qi=acbqj2bq_i = \frac{a - c - b q_j}{2b}

联立两个最优反应函数解得古诺-纳什均衡产量 q1=q2=(ac)/(3b)q_1^* = q_2^* = (a - c)/(3b)。与垄断或合谋产量 (ac)/(2b)(a-c)/(2b) 相比,双寡头竞争下的总产量更高、价格更低,展示了竞争增进社会福利的机制。

均衡精炼

纳什均衡在多阶段或不完全信息博弈中可能包含不可信的威胁或承诺,因此博弈论学者发展了一系列精炼(Refinement)概念。子博弈精炼纳什均衡(SPNE)要求均衡策略在每个子博弈中仍构成纳什均衡,通过反向归纳法剔除不可信威胁。贝叶斯纳什均衡(BNE)将纳什均衡扩展至不完全信息环境,参与者的类型为私人信息,均衡中按贝叶斯规则更新信念并最大化期望效用。进一步的精炼还包括颤抖手精炼均衡(Selten, 1975)和序贯均衡(Kreps \& Wilson, 1982),后者将信念一致性与序贯理性结合,对均衡施加更严格的稳健性要求。全局博弈(Global Games)框架则通过引入关于基本面的微小不确定性来消除多重均衡。

经济学应用与意义

纳什均衡是当代经济学分析不可或缺的工具,已渗透至几乎所有涉及策略互动的领域。在产业组织中,伯川德竞争斯塔克尔伯格模型垄断竞争均以纳什均衡为基础解概念;在拍卖理论机制设计中,投标者的均衡策略和激励相容约束均围绕纳什均衡构建;在国际经济学中,关税战与贸易谈判的分析框架同样是纳什均衡;在宏观经济学中,中央银行的时间不一致性问题和巴罗-戈登模型也以纳什均衡为分析基准。此外,演化博弈论演化稳定策略(ESS)与纳什均衡之间存在深刻联系——ESS必定是纳什均衡的精炼,为均衡的稳定性提供了演化视角的微观基础。

纳什均衡的根本意义在于:它将经济学从"单人决策"范式推进至"交互决策"范式,使得经济学家能够在统一的分析框架下研究从市场定价到制度形成的广泛社会互动,堪称经济学理论在20世纪最重要的方法论突破之一。