ARTICLE

subgame

子博弈（Subgame）是扩展式博弈（extensive-form game）中的一个核心结构概念，指从某一决策节点出发、包含该节点之后所有后续节点与信息集的一个完整的博弈子结构。子博弈的概念是定义子博弈完美均衡（Subgame Perfect Equilibrium, SPE）的基础，后者是动态博弈中最具影响力的均衡精炼概念之一。理解子博弈的严格定义及其在

浏览 5 更新 2026-05-26

子博弈（Subgame）是扩展式博弈（extensive-form game）中的一个核心结构概念，指从某一决策节点出发、包含该节点之后所有后续节点与信息集的一个完整的博弈子结构。子博弈的概念是定义子博弈完美均衡（Subgame Perfect Equilibrium, SPE）的基础，后者是动态博弈中最具影响力的均衡精炼概念之一。理解子博弈的严格定义及其在均衡分析中的作用，对于分析序贯互动中的承诺、威胁和可信性问题具有基础性意义。

子博弈的定义与形式化条件

在扩展式博弈的形式化框架中，子博弈的严格定义需要满足三个关键条件。第一，起始节点：子博弈必须始于一个单一的决策节点，且该节点属于某个参与者的信息集。第二，封闭性：子博弈必须包含该起始节点之后的所有后续节点（successors），即如果某个节点属于子博弈，则该节点的所有后续节点也必须属于子博弈。第三，信息集完整性：子博弈不能割裂任何信息集——如果某个信息集中的任一节点被包含在子博弈中，则该信息集中的所有节点都必须被包含在子博弈中。这一条件至关重要：它确保了子博弈本身是一个信息完备的博弈结构，参与者在该子博弈中拥有与完整博弈中相同的不确定性结构。以完美信息博弈（perfect-information game）为例，由于每个信息集只包含一个决策节点，任何单节点出发的后继树均自动满足信息集完整性条件，因此完美信息博弈中的每一个决策节点都定义了一个子博弈。而在不完美信息博弈（imperfect-information game）中，由于信息集可能包含多个节点，并非所有决策节点都能引出合法的子博弈——只有那些起始节点恰好是其所属信息集中唯一一个被包含在子博弈中的节点时，该子博弈才得以合法定义。

子博弈完美均衡

子博弈完美均衡是对纳什均衡的精炼，其核心思想是要求均衡策略在每一个子博弈上都能构成纳什均衡。正式地，策略组合 $\sigma^* = (\sigma_1^*, \sigma_2^*, \dots, \sigma_n^*)$ 是一个子博弈完美均衡，当且仅当对于扩展式博弈的每一个子博弈， $\sigma^*$ 在该子博弈上的限制（restriction）构成了该子博弈的一个纳什均衡。这一概念由莱因哈德·泽尔腾（Reinhard Selten, 1965）首次提出，标志着博弈论从静态分析向动态分析的关键跨越。子博弈完美均衡的核心贡献在于它能够排除纳什均衡中存在的不可信威胁（incredible threats）。在纳什均衡中，一个参与者可以"威胁"在某个决策节点上采取某种行动，只要这一威胁从未在实际博弈路径上被触发即可。然而，如果该威胁在子博弈层面上并非最优反应（即偏离该威胁可以在该子博弈中提升偏离者的收益），那么这一威胁就是不可信的——理性参与者不会在需要时真正实施它。子博弈完美均衡通过对所有子博弈施加纳什均衡条件，自动剔除了此类不可信威胁，使得均衡路径上的行动依赖序列理性（sequential rationality）。

逆向归纳法与子博弈完美均衡

在完美信息有限博弈中，子博弈完美均衡可以通过逆向归纳法（Backward Induction）来求解。逆向归纳法的基本步骤是：从博弈树的终局节点开始，在每个决策节点上，选择使当前参与者收益最大化的行动，并将其余分支"剪除"；然后逐层回溯至初始节点，最终得到的策略组合即为该完美信息有限博弈的唯一子博弈完美均衡（在无收益等同的条件下）。逆向归纳法之所以能够保证子博弈完美性，是因为它所操作的每一个决策节点恰好定义了一个子博弈——逆向归纳法实质上是在逐一求解每个子博弈的纳什均衡，并将均衡策略"由后往前"地传递。这一逻辑在连锁店悖论（Chain Store Paradox, Selten, 1978）中得到了经典展示。在市场进入博弈中，在位者若在前一期保持高价并容忍进入者，则进入者在后续期的进入将变得更加有利可图——逆向归纳法的结果表明，在位者的"低价报复"威胁在最后一期不可信，因而在每一期都无法阻止进入，尽管在博弈初期看似存在某种合作可能。这一悖论深刻揭示了在有限期动态博弈中，长链谈判结构并不必然有利于维持合作。

子博弈的扩展与局限

子博弈概念在不同博弈结构中有着重要的扩展。在重复博弈（Repeated Games）中，每一期阶段博弈进行完毕后，历史行动构成的信息集定义了从该期出发的子博弈。子博弈完美均衡在重复博弈中通过"惩罚策略"来支撑合作：例如在无限重复囚徒困境中，触发策略（Trigger Strategy）要求参与者在对方背叛后永久切换至纳什均衡行动——这一策略在每一个子博弈上（包括那些已经发生了偏离的子博弈）都必须构成纳什均衡，因此触发策略的可行性取决于贴现因子是否足够大。在包含随机行动的博弈中，子博弈的定义需要拓展至"完美公共均衡"（Perfect Public Equilibrium, PPE）的分析框架。此外，子博弈概念的一个内在局限在于，它要求子博弈的起始节点及其信息集的完整性条件，这意味着在不完美信息博弈中，一些结构上非常自然的"子博弈"可能因为信息集被割裂而无法合法定义。为此，博弈论发展了完美贝叶斯均衡（Perfect Bayesian Equilibrium, PBE）和序列均衡（Sequential Equilibrium）等更为精细的精炼概念，它们不要求从所有子博弈上检查均衡条件，而是通过信念系统和序贯合理性来替代子博弈完备性要求。完美贝叶斯均衡在每个信息集上（包括零概率事件所对应的信息集）都要求参与者的信念由贝叶斯规则更新，且行动相对信念是最优的，从而在不完美信息情境中实现了与子博弈完美均衡类似的可信性约束。

应用

子博弈及子博弈完美均衡在经济学的多个领域得到了广泛运用。在产业组织理论中，企业的进入威慑和价格竞争被建模为动态博弈，子博弈完美均衡用于分析在何种条件下在位者能够通过容量投资或广告投入来可信地威慑进入。在讨价还价理论中，鲁宾斯坦轮流出价模型（Rubinstein, 1982）通过逆向归纳法求解无限期轮流讨价还价的子博弈完美均衡，证明了在贴现因子对称的条件下，均衡分割比例趋向于均分——这一结论成为现代谈判分析的基础。在宏观经济学中，政策制定者的动态一致性（dynamic consistency）问题本质上是一个序贯博弈的子博弈完美均衡问题：一项事前最优的政策（如低通胀承诺）可能在事后因激励变化而被推翻，只有当该政策在每个子博弈层面上均构成最优策略时才具备时间一致性。在政治经济学中，选举竞争与政权更替的动态博弈分析依赖于子博弈完美均衡来刻画政治承诺的可信性与权力交接的稳定性。实验经济学的研究表明，个体在子博弈结构简单的博弈中——如两期囚徒困境——通常能较好地逼近子博弈完美均衡的预测，但随着博弈树的复杂化（如多期、多分支的信息结构），有限理性的个体行为与子博弈完美均衡的偏差会明显增大，这为行为博弈论中对"层级理性"和"认知层级"（Cognitive Hierarchy）的研究提供了经验起点。子博弈的概念虽已诞生近六十年，但它依然是博弈论教科书中定义动态理性标准的基石，也是连接古典博弈分析与行为博弈研究的桥梁。

参考文献

Selten, R. (1965). Spieltheoretische Behandlung eines Oligopolmodells mit Nachfrageträgheit. *Zeitschrift für die gesamte Staatswissenschaft*, 121, 301–324.
Selten, R. (1978). The chain store paradox. *Theory and Decision*, 9(2), 127–159.
Rubinstein, A. (1982). Perfect equilibrium in a bargaining model. *Econometrica*, 50(1), 97–109.
Kreps, D. M., \& Wilson, R. (1982). Sequential equilibria. *Econometrica*, 50(4), 863–894.
Fudenberg, D., \& Tirole, J. (1991). *Game Theory*. MIT Press.
Osborne, M. J., \& Rubinstein, A. (1994). *A Course in Game Theory*. MIT Press.

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。