ARTICLE

Nash Equilibrium

纳什均衡 (Nash Equilibrium) 纳什均衡是博弈论中最核心的概念之一,由数学家约翰·纳什(John Forbes Nash Jr.)于1950年在其普林斯顿大学博士论文中提出。纳什均衡描述了一种策略组合状态:在给定其他参与者策略不变的前提下,没有任何参与者能够通过单方面改变自己的策略而获得更高的收益。这一概念将博弈论从零和博弈拓展到非合作的一般

浏览 0 更新 2026-05-25

纳什均衡 (Nash Equilibrium)

纳什均衡博弈论中最核心的概念之一,由数学家约翰·纳什(John Forbes Nash Jr.)于1950年在其普林斯顿大学博士论文中提出。纳什均衡描述了一种策略组合状态:在给定其他参与者策略不变的前提下,没有任何参与者能够通过单方面改变自己的策略而获得更高的收益。这一概念将博弈论从零和博弈拓展到非合作的一般博弈分析,奠定了现代非合作博弈理论的基石。

历史背景

纳什均衡的概念最早萌芽于1838年古诺对双寡头竞争的分析,古诺在其《财富理论的数学原理研究》中提出了古诺均衡,即两家企业在产量竞争中达到的稳定状态。此后,1928年冯·诺伊曼证明了零和博弈的极小化极大定理,但该成果仅限于二人零和博弈。1944年冯·诺伊曼与摩根斯坦合著的《博弈论与经济行为》系统建立了博弈论的基本框架,但仍然未能处理一般非合作博弈。

1950年,22岁的约翰·纳什在其一篇仅有一页篇幅的短文中首次提出了纳什均衡的概念,并将其存在性建立在不动点定理之上。1951年,纳什发表第二篇论文《非合作博弈》,进一步深化了分析框架。这一突破性贡献使纳什获得了1994年诺贝尔经济学奖(与海萨尼泽尔腾共享)。

正式定义

考虑一个标准形式的博弈:G=(N,{Si}iN,{ui}iN)G = (N, \{S_i\}_{i\in N}, \{u_i\}_{i\in N}),其中 N={1,2,,n}N = \{1, 2, \ldots, n\} 为参与者集合,SiS_i 为参与者 ii 的策略集,ui:jNSjRu_i: \prod_{j\in N} S_j \to \mathbb{R} 为参与者 ii 的收益函数。策略组合 (s1,s2,,sn)(s_1^*, s_2^*, \ldots, s_n^*) 是一个纯策略纳什均衡,当且仅当对每一个参与者 ii 和每一个备选策略 siSis_i \in S_i,有:

ui(si,si)ui(si,si)u_i(s_i^*, s_{-i}^*) \ge u_i(s_i, s_{-i}^*)

其中 sis_{-i}^* 表示除参与者 ii 外所有其他参与者的均衡策略。换言之,纳什均衡点是每个参与者最优反应对应的策略组合的交集。

纯策略与混合策略纳什均衡

纳什均衡分为两类:

  • 纯策略纳什均衡:每个参与者确定性地选择一个单一策略,且上述不等式成立。例如,在囚徒困境中,(坦白,坦白)构成纯策略纳什均衡。在协调博弈中,可能存在多个纯策略纳什均衡,如左右行驶规则博弈。
  • 混合策略纳什均衡:参与者以一定概率分布随机选择策略。例如,在剪刀石头布博弈中,唯一的纳什均衡是每个参与者以三分之一的概率随机出拳。纳什在1950年的定理中证明了:在任何有限博弈(参与者有限且每个参与者的纯策略有限)中,至少存在一个混合策略纳什均衡。混合策略均衡的直观含义是让对手无法预测己方行动,从而使其在任何纯策略上都无差异。

存在性定理

纳什存在性定理是博弈论中最基本的结论之一。该定理指出:任何有限策略型博弈均存在至少一个纳什均衡(允许混合策略)。证明的核心工具是布劳威尔不动点定理角谷静夫不动点定理:构造一个从策略组合空间到自身的连续映射,其不动点即为纳什均衡。对于非有限博弈(如连续策略空间),若策略集为紧凸集且收益函数连续拟凹,则均衡存在性可由德布鲁-盖尔-二阶堂定理保障。

与占优策略和帕累托最优的关系

纳什均衡并不一定是帕累托最优的。在囚徒困境中,(坦白,坦白)既是占优策略均衡又是纳什均衡,但(沉默,沉默)能给双方带来更高的总收益。这一现象揭示了个人理性与集体理性之间的深刻矛盾,也是博弈论对经济学和社会科学的重大贡献之一。

  • 占优策略均衡:无论对手选择什么策略,每个参与者都有唯一的最优策略。占优策略均衡一定是纳什均衡,反之不真。
  • 帕累托最优:一种资源配置状态,无法在不损害任何一方的情况下改善另一方的福利。纳什均衡不一定帕累托最优,反之亦然。

计算方法

求解纳什均衡的方法因博弈类型而异。对于 2×22\times 2 双矩阵博弈,可通过枚举法直接检验纯策略均衡,或利用无差异条件求解混合策略均衡。对于更一般的有限博弈,可将其转化为线性互补问题并使用莱姆克-豪森算法求解。近年来,基于梯度下降的深度学习方法和虚拟对局等迭代学习方法成为求解大规模博弈中纳什均衡的重要工具,尤其在人工智能领域具有广泛应用。

纳什均衡的应用领域

纳什均衡的应用跨越多个学科:

  • 产业组织古诺竞争伯川德竞争斯塔克尔伯格模型均以纳什均衡为解概念,用于分析企业定价、产量和进入决策。
  • 拍卖理论:在维克里拍卖、英式拍卖和荷式拍卖中,投标人的最优出价策略构成纳什均衡,用于分析最优拍卖机制设计。
  • 国际贸易:关税博弈中,两国在纳什均衡下选择的关税水平往往低于最优关税但高于自由贸易关税,解释了贸易摩擦的形成机制。
  • 公共经济学:公共品自愿供给中的搭便车问题可以通过纳什均衡框架分析,显示个人理性决策导致公共品供给不足。
  • 环境经济学:国际气候协定中各国的减排承诺可建模为一个博弈,纳什均衡常低于社会最优水平,产生全球气候治理困境。

扩展与精炼

纳什均衡之后,学者们提出了一系列精炼概念以应对多重均衡和博弈时序问题:

  • 子博弈完美均衡泽尔腾,1965):要求策略在每个子博弈上都构成纳什均衡,剔除了基于不可信威胁的均衡,适用于动态博弈分析。
  • 贝叶斯纳什均衡海萨尼,1967):将纳什均衡扩展到不完美信息博弈,引入了类型和先验信念的概念,使博弈论能够处理信息不对称问题。
  • 完美贝叶斯均衡:结合了子博弈完美均衡与贝叶斯纳什均衡,适用于动态不完美信息博弈,是信号博弈和精炼贝叶斯均衡的基础。
  • 颤抖手完美均衡:考虑参与者以极小概率犯错时的均衡稳健性,通过分析均衡在微小扰动下的极限行为来筛选更合理的均衡。

批评与局限

纳什均衡并非没有争议。首先,多重均衡问题——许多博弈存在多个纳什均衡,理论本身不提供选择标准,需要借助均衡精炼、焦点效应或社会惯例来缩小范围。其次,当参与者使用混合策略时,现实中对随机化策略的行为解释力有限——人们在实际决策中很少主动进行精确的随机化。第三,纳什均衡假设参与者的完全理性:每个参与者能够准确推断对手的策略,并相应地最大化自己的收益。实验经济学(如最后通牒博弈公共品博弈)发现,实际行为系统性地偏离纳什均衡预测,公平、互惠和利他等社会偏好起着重要作用。此外,纳什均衡的静态性质使其难以刻画学习和演化过程,而这催生了演化博弈论学习模型等新方向的发展。尽管如此,纳什均衡作为理论基准和预测起点,仍然是博弈论和现代经济学不可或缺的分析工具。