ARTICLE

子博弈完美均衡

子博弈完美均衡 (Subgame Perfect Equilibrium) 子博弈完美均衡（Subgame Perfect Equilibrium, SPE）是博弈论（Game Theory）中用于分析动态博弈（Dynamic Game）或扩展式博弈（Extensive-Form Game）的核心解概念。由德国经济学家莱因哈德·泽尔腾（Reinhard Se

浏览 3 更新 2025-10-26

子博弈完美均衡 (Subgame Perfect Equilibrium)

子博弈完美均衡（Subgame Perfect Equilibrium, SPE）是博弈论（Game Theory）中用于分析动态博弈（Dynamic Game）或扩展式博弈（Extensive-Form Game）的核心解概念。由德国经济学家莱因哈德·泽尔腾（Reinhard Selten）于1965年在其论文《一个具有需求惯性的寡头博弈模型》中首次提出，泽尔腾凭借这一贡献与约翰·纳什、约翰·海萨尼共同获得1994年诺贝尔经济学奖。SPE是对纳什均衡（Nash Equilibrium）的精炼（refinement），通过要求博弈参与者在每个子博弈中都采取纳什均衡策略，从而排除那些在动态情境中不可置信的威胁或承诺。

SPE的核心思想可概括为：一个策略组合必须是序贯理性的（Sequentially Rational）——在博弈树的每一个决策节点上，给定参与者在该节点上的信念，其策略必须是最优的。这意味着策略不仅在整场博弈的均衡路径（equilibrium path）上是最优的，在非均衡路径（off-equilibrium path）上也必须是最优的。这一要求使得SPE成为分析动态博弈中承诺、威胁与可信性问题的基础工具。

子博弈的概念

理解SPE的前提是准确把握子博弈（Subgame）的含义。在扩展式博弈中，一个子博弈是原博弈的一个完整且独立的部分，满足三个条件：其一，始于一个单节点信息集（Singleton Information Set），即该节点本身是一个独立信息集；其二，包含该节点之后的所有后续节点和分支，不遗漏任何后续可能性；其三，不切割任何信息集——即子博弈不能将一个信息集中的部分节点包含在内而将其他节点排除在外。这一条件在不完美信息博弈中尤为重要，确保子博弈在结构上是自洽的。

形式化定义

设 $\Gamma$ 为一个扩展式博弈（Extensive-Form Game），策略组合 $\sigma^*$ 是子博弈完美均衡，当且仅当对于博弈 $\Gamma$ 中的每一个子博弈 $G$ ，策略组合 $\sigma^*$ 在 $G$ 上的限制（restriction）构成 $G$ 的一个纳什均衡。该定义意味着SPE比纳什均衡具有更强的约束力。任何一个SPE必然是一个纳什均衡，但反之未必成立——某些纳什均衡可能包含不可置信的威胁，即在博弈某些非均衡路径上，参与者的策略选择并非最优，因而在那些子博弈中不构成均衡。

逆向归纳法与SPE的求解

求解完美信息（Perfect Information）动态博弈中SPE的基本方法是逆向归纳法（Backward Induction）。该方法从博弈树的末端节点（Terminal Nodes）开始，逐层向前推导：在每个决策节点上，当前参与者选择带来最高收益的行动，并假设后续参与者在后续节点上也会理性地做出最优选择。逆向归纳法所得到的策略组合构成了该博弈的SPE。

以经典的进入威慑博弈（Entry Deterrence Game）为例：在位垄断者（Incumbent）面临一个潜在进入者（Entrant）的决策。进入者先选择"进入"或"不进入"；若不进入，收益为（在位者得2, 进入者得0）；若进入，在位者选择"容纳"或"反击"。若容纳，双方各得1；若反击，进入者得-1，在位者得0。使用逆向归纳法分析：在位者在子博弈中若进入者已进入，容纳（得1）优于反击（得0），故在位者会选择容纳。进入者预见到这一结果，比较进入（得1）与不进入（得0）后选择进入。均衡结果为（进入, 容纳），双方各得1。该博弈还存在另一个纳什均衡——（不进入, 反击），即在位者威胁"若你进入我就反击"；但在位者的"反击"威胁是不可置信的，因为一旦进入真的发生，在位者选择反击会使自身收益（0）低于容纳（1），理性的在位者不会执行该威胁。逆向归纳法排除了这一不可置信威胁的纳什均衡。

SPE与纳什均衡的关系

SPE与纳什均衡的关系可通过以下层次理解：纳什均衡要求策略组合在整场博弈的层面互为最佳应对，但不对非均衡路径上的行为施加约束；SPE则进一步要求策略组合在每一个子博弈上都互为最佳应对。因此SPE是纳什均衡的一个子集。当博弈只有一个子博弈（即博弈自身）时——例如完全信息的静态博弈——SPE退化为纳什均衡。随着博弈的扩展式结构越复杂、子博弈越多，SPE的约束力越强，能够剔除的不可置信均衡也越多。

不完美信息与SPE

当博弈涉及不完美信息（Imperfect Information）——即存在非单节点信息集时，逆向归纳法不再适用。此时需要采用更一般的求解方法，通常称为库恩算法（Kuhn's Algorithm）。在不完美信息扩展式博弈中，求解SPE需要结合参与者在信息集中的信念（Beliefs），要求策略在每一个信息集上都是最优的。这引出了完美贝叶斯均衡（Perfect Bayesian Equilibrium, PBE）——一种与SPE密切相关但更适用于不完全信息动态博弈的解概念。PBE在SPE的基础上增加了关于参与者信念的一致性要求，是分析信号博弈（Signaling Games）和拍卖等不完全信息动态博弈的标准工具。

泽尔腾的连锁店悖论

泽尔腾提出的连锁店悖论（Chain Store Paradox）展示了SPE分析中一个引人深思的结论。假设一家连锁店在多个不同的市场上面对潜在的进入者。在每个市场，进入者先选择进入与否，连锁店再选择容纳或反击。根据逆向归纳法，在最后一个市场，连锁店会选择容纳（因无后续市场的声誉效应），因此倒数第二个市场的进入者会预期到这一点而选择进入，如此递归至第一个市场。逆向归纳法预言在每一个市场中进入都会发生。然而现实中我们经常观察到连锁店对早期进入者采取反击以建立威慑声誉——这一现象与SPE预测之间的张力被称为"连锁店悖论"，它揭示了有限理性、不完全信息和声誉效应在动态博弈中的重要作用，也推动了后续关于声誉模型（如克雷普斯、米尔格罗姆等人的开创性研究）的发展。

重要意义与扩展

子博弈完美均衡是现代博弈论中最重要的精炼概念之一。它奠定了分析动态承诺（Dynamic Commitment）、可信威胁（Credible Threats）、议价博弈（Bargaining Games）、寡头竞争（Oligopolistic Competition）以及机制设计（Mechanism Design）等问题的理论基础。在产业组织理论（Industrial Organization）中，SPE被广泛用于分析价格竞争、产能决策和纵向约束；在政治经济学（Political Economy）中，用于分析立法博弈和制度变迁；在国际关系（International Relations）中，用于分析威慑战略和军备竞赛。SPE的局限性在于逆向归纳法对参与者的理性和共同知识（Common Knowledge）要求极高，且在某些无限期博弈中SPE可能存在多个，所谓的民间定理（Folk Theorem）表明，在无限重复博弈中，任何可行的个人理性收益向量都可以通过SPE来实现，这使得SPE在重复博弈中的预测力有所减弱。此外，对逆向归纳法本身的逻辑基础也存在哲学层面的争议——部分学者认为逆向归纳法依赖于对"反事实"情境的过度理想化假设。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。