ARTICLE

非零和博弈

非零和博弈 (Non-Zero-Sum Game) 非零和博弈 (Non-Zero-Sum Game) 是博弈论中的核心概念，指的是参与者之间的利益关系并非严格对立——一方所得不再必然等于另一方所失的一类策略互动。在非零和博弈中，所有参与者的支付 (payoff) 之和不必恒为零（或常数），这意味着存在合作共赢或两败俱伤的可能。该概念与零和博弈形成根本性对立

浏览 4 更新 2025-10-26

非零和博弈 (Non-Zero-Sum Game)

非零和博弈 (Non-Zero-Sum Game) 是博弈论中的核心概念，指的是参与者之间的利益关系并非严格对立——一方所得不再必然等于另一方所失的一类策略互动。在非零和博弈中，所有参与者的支付 (payoff) 之和不必恒为零（或常数），这意味着存在合作共赢或两败俱伤的可能。该概念与零和博弈形成根本性对立，最早由 John von Neumann 和 Oskar Morgenstern 在《Theory of Games and Economic Behavior》(1944) 中系统区分，后经 John Nash 的均衡理论赋予了非零和博弈独立的分析框架。

形式定义

考虑一个 $n$ 人策略博弈 $G = \langle N, (S_i)_{i \in N}, (u_i)_{i \in N} \rangle$ ，其中 $N = \{1, 2, \ldots, n\}$ 为参与者集合， $S_i$ 为参与者 $i$ 的策略空间， $u_i: \prod_{j \in N} S_j \to \mathbb{R}$ 为参与者 $i$ 的支付函数。博弈 $G$ 称为零和博弈当且仅当对任意策略组合 $s = (s_1, \ldots, s_n)$ ，有：

\sum_{i=1}^{n} u_i(s) = 0

若上述条件不成立，则 $G$ 为非零和博弈。若对所有 $s$ 均有 $\sum_i u_i(s) > 0$ ，称为正和博弈 (Positive-Sum Game)；若恒有 $\sum_i u_i(s) < 0$ ，称为负和博弈 (Negative-Sum Game)。实际场景中，非零和博弈的支付和通常随策略组合变化而改变，既可能出现互惠共赢区域，也可能存在共同毁灭区域。

经典案例

非零和博弈的丰富性通过以下经典模型得以体现：

囚徒困境 (Prisoner's Dilemma)：两名嫌疑人被分开审讯。若双方都沉默 (合作)，各判 1 年；若双方都坦白 (背叛)，各判 3 年；若一方坦白而另一方沉默，坦白者获释、沉默者判 5 年。支付矩阵为： \[ \begin{pmatrix} (-1, -1) & (-5, 0) \\ (0, -5) & (-3, -3) \end{pmatrix} \] 唯一的纳什均衡为 (坦白, 坦白)，但 (合作, 合作) 对双方帕累托更优——个体理性与集体理性的冲突正是非零和博弈的核心议题。
猎鹿博弈 (Stag Hunt)：Rousseau 描绘的猎人困境。两人可合作猎鹿 (各得 4)，或各自捕兔 (各得 2)；若一方猎鹿而另一方捕兔，猎鹿者空手而归 (0)，捕兔者得 2。该博弈有两个纯策略纳什均衡——(鹿, 鹿) 帕累托占优于 (兔, 兔)，但不合作的风险使得协调失败成为可能。
性别战 (Battle of the Sexes)：一对伴侣偏好不同的共同活动（如 $A$ 偏好拳击、 $B$ 偏好芭蕾），但最不愿各自独处。支付结构为： \[ \begin{pmatrix} (3, 2) & (0, 0) \\ (0, 0) & (2, 3) \end{pmatrix} \] 有两个纯策略纳什均衡和一个混合策略均衡，核心问题是协调而非对抗。这属于协调博弈 (Coordination Game) 的一种。
胆小鬼博弈 (Chicken)：两辆车对冲：若双方都转向 (懦夫)，各得 0；若双方都直行，相撞毁灭 (-10)；若一方转向而另一方直行，转向者丢面子 (-1)，直行者赢声誉 (+5)。该博弈刻画了核威慑等边缘策略 (brinkmanship) 的冷酷逻辑。

非零和博弈中的均衡概念

在非零和博弈中，纳什均衡 (Nash Equilibrium) 仍然是核心解概念：策略组合 $s^*$ 构成纳什均衡当且仅当对每个参与者 $i$ ：

u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*), \quad \forall s_i \in S_i

然而，非零和博弈通常存在多重均衡（如性别战、猎鹿博弈），由此衍生出均衡精炼问题：子博弈精炼均衡 (Selten, 1965) 在动态非零和博弈中剔除不可置信威胁；贝叶斯纳什均衡 (Harsanyi, 1967-1968) 处理不完全信息下的非零和博弈，使机制设计成为可能；颤抖手精炼均衡 (Selten, 1975) 进一步要求均衡对微小扰动稳健。

特别地，在重复非零和博弈中，无名氏定理 (Folk Theorem) 表明：若参与人足够耐心，任何满足个体理性的可行支付向量均可作为子博弈精炼均衡的平均支付出现——这意味着在无限次重复囚徒困境中，合作可以成为均衡结果（如通过 Tit-for-Tat 策略或 触发策略），从根本上改变了单次博弈的悲观结论。

扩展与应用

非零和博弈的视角深刻影响了经济学与社会科学的多项议程：

国际贸易：比较优势理论表明自由贸易是典型的正和博弈——双方通过专业化分工与交换，使总福利增加，而非一国收益以另一国受损为代价。David Ricardo 的比较成本原理即是这一逻辑的经典体现。
气候变化与公共品供给：全球减排是一个非零和博弈。各国单独减排的成本由本国承担，收益却由全人类共享，这构成公共品博弈中"搭便车" (free-riding) 的集体行动困境。然而合作减排的整体净收益为正（正和），关键在于设计有效的国际协调机制（如京都议定书、巴黎协定）。
产业组织与企业竞争：寡头市场的古诺竞争中，企业总产量介于完全竞争产量与垄断产量之间；合谋 (collusion) 将市场推向接近垄断利润的联合最优结果，但每个企业有背叛激励——这正是非零和博弈在产业组织中的直接呈现。
演化博弈论：Smith 与 Price (1973) 将非零和博弈引入生物学。演化稳定策略 (ESS) 刻画了种群在自然选择压力下无法被突变入侵的均衡行为，猎鹿博弈与鹰鸽博弈 (Hawk-Dove Game) 是解释合作演化与冲突行为的基本模型。
谈判与分配：Nash 谈判解 (Nash Bargaining Solution, 1950) 将两人非零和谈判建模为公理化谈判问题，预测谈判结果将最大化双方的纳什积 $(u_1 - d_1)(u_2 - d_2)$ ，其中 $d_i$ 为谈判破裂时的保留效用。这一框架是劳动经济学、政治经济学中分配分析的理论基础。

理论发展脉络

非零和博弈的理论演进可分为三个关键阶段。第一阶段 (1944-1950)：von Neumann 和 Morgenstern 虽然奠定了博弈论的公理化基础，但他们的分析重心在零和博弈，对非零和博弈仅做了初步分类。转折点出现在 extbf{John Nash} 的两篇里程碑论文 (1950, 1951)，他证明任何有限博弈（无论是否零和）均存在混合策略纳什均衡，从而将非零和博弈纳入统一的均衡分析框架，并开创性地区分了 extbf{合作博弈} (Cooperative Game) 与 extbf{非合作博弈} (Non-Cooperative Game)。

第二阶段 (1960-1975)： extbf{Reinhard Selten} 引入子博弈精炼均衡，解决了动态非零和博弈中纳什均衡过多的问题； extbf{John Harsanyi} 发展贝叶斯博弈理论，将不完全信息建模为类型空间上的非零和博弈，两人的贡献与 Nash 共同获得 1994 年诺贝尔经济学奖。同期， extbf{Thomas Schelling} 在《The Strategy of Conflict》(1960) 中以非零和博弈分析核威慑与谈判中的承诺、威胁与焦点 (focal points)，深刻影响了冷战时期的安全战略思维。

第三阶段 (1980 至今)：非零和博弈的工具被系统引入产业组织（Tirole, 1988）、契约理论与机制设计。 extbf{Wilson}、 extbf{Milgrom}、 extbf{Holmström} 等学者将非零和博弈中激励相容约束的分析推向拍卖设计、最优税收与公司金融等应用领域，由此获得多届诺奖（1996, 2007, 2016, 2020）。与此同时， extbf{演化博弈论} (Maynard Smith, 1982; Weibull, 1995) 和 extbf{行为博弈论} (Camerer, 2003) 通过引入有限理性与学习动态，为非零和博弈的均衡选择与演化提供了新的微观基础。

局限与常见误区

非零和博弈的概念在通俗话语中常被误用或过度简化。首先，"非零和"并不等同于"正和"：许多非零和博弈包含严重的利益冲突，如囚徒困境中个体最优选择导致集体次优结果，显示非零和条件下市场失灵的可能性。其次，非零和性并不自动保证合作实现——协调失败、承诺不可信、信息不对称等因素可能使帕累托最优结果无法达成，这正是机制设计理论关注的核心问题。再次，在涉及外部性的情境中，缺乏产权界定与交易机制的非零和博弈可能退化为"公地悲剧"式的负和博弈，提醒我们制度安排在非零和世界中的决定性作用。最后，在经验研究中，区分零和与非零和的实证识别并非易事：观察到的竞争行为可能掩盖潜在的共同利益，反之，表面的合作也可能是零和再分配的精巧伪装，这对反垄断执法、贸易政策评估等政策实践提出了深层的方法论挑战。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。