ARTICLE

extensive form games

展开型博弈 (Extensive Form Games) 展开型博弈（Extensive Form Game），又称扩展式博弈，是博弈论中用于描述序贯决策（Sequential Decision Making）的标准建模框架。与策略型博弈（Strategic/Normal Form）将参与人的策略压缩为同时选择不同，展开型通过博弈树（Game Tree）显式

浏览 0 更新 2025-10-29

展开型博弈 (Extensive Form Games)

展开型博弈（Extensive Form Game），又称扩展式博弈，是博弈论中用于描述序贯决策（Sequential Decision Making）的标准建模框架。与策略型博弈（Strategic/Normal Form）将参与人的策略压缩为同时选择不同，展开型通过博弈树（Game Tree）显式刻画参与人的行动顺序、每一步可用的选择以及各参与人在决策时掌握的信息，因此天然适用于分析具有先后次序的互动情景。

博弈树的基本构成

展开型博弈由以下基本要素组成：

节点（Nodes）：分为决策节点（Decision Nodes）和终节点（Terminal Nodes）。每个决策节点标注当前行动的参与人，终节点标注各参与人的支付（Payoffs）。
边（Edges/Branches）：从决策节点出发的每条边代表该参与人在该时点可选择的行动。
信息集（Information Sets）：将参与人无法区分的决策节点划入同一虚线框。若参与人在该集合中不知道自己所处的精确节点，则该信息集为非单点信息集（Non-singleton），此时博弈具有不完美信息（Imperfect Information）。
参与人函数：将每个决策节点映射到对应的参与人。
支付函数：将每个终节点映射到各参与人的效用向量。

展开型博弈的图示即为博弈树。博弈树的根表示博弈开始，从根到任一终节点的路径构成一个博弈路径（Play），每一条完整路径对应一种可能的博弈结果。

完美信息与不完美信息

若展开型博弈中所有信息集都是单点的（即每个参与人在每次行动时都完全知晓博弈此前发生的全部历史），则称该博弈具有完美信息（Perfect Information）。否则，称该博弈具有不完美信息（Imperfect Information）。需要区分的是，不完美信息不等同于不完全信息（Incomplete Information）——前者涉及对历史行动的不确定，后者涉及对他人类型（如支付函数参数）的不确定。Harsanyi将不完全信息博弈转化为不完美信息博弈的框架称为Harsanyi变换（Harsanyi Transformation）。

纯策略与行为策略

在展开型博弈中，纯策略（Pure Strategy）为每个信息集指定一项行动的完整计划，即使某些信息集在均衡路径上可能无法到达。策略的数量随信息集数量呈指数增长。与之相对，行为策略（Behavioral Strategy）在每个信息集上独立地随机化行动选择。Kuhn定理指出，在具有完美回忆（Perfect Recall）的展开型博弈中，混合策略与行为策略是等价的——即任何混合策略的支付分布均可由行为策略复制。完美回忆要求参与人永不遗忘自己曾知道的信息或曾采取的行动。

子博弈与子博弈完美均衡

展开型博弈的一个核心分析工具是子博弈（Subgame）。子博弈从一个单点信息集开始，包含该节点及其所有后继节点，并且不能切割任何信息集。基于子博弈概念，子博弈完美纳什均衡（Subgame Perfect Nash Equilibrium, SPNE）将纳什均衡精炼为：不仅在原博弈的均衡路径上每个参与人的策略是最优反应，在每一个子博弈中也必须构成纳什均衡。SPNE排除了依赖不可信威胁（Non-credible Threat）的纳什均衡，是分析序贯理性（Sequential Rationality）的基础解概念。

反向归纳法

对于有限完美信息展开型博弈，反向归纳法（Backward Induction）提供了一种构造子博弈完美均衡的算法。从博弈树的终节点向上逐层求解：在每一个决策节点处，给定后继节点的均衡支付，当前参与人选择最大化自身支付的行动。由于完美信息保证每个信息集均为单点，反向归纳法可唯一确定均衡路径（若不出现支付相同的平局情况）。Zermelo定理指出，任何有限完美信息零和博弈都具有唯一的反向归纳解。

反向归纳法的前提假设——所有参与人是理性且共同知识——在长博弈中受到理论和实验的挑战。著名的蜈蚣博弈（Centipede Game）实验中，参与人通常在较早阶段就终止博弈，偏离反向归纳法的预测，揭示了有限理性与互惠偏好的重要性。

与策略型博弈的关系

任何展开型博弈都可转换为策略型博弈，方法是将每个参与人的纯策略枚举为策略空间中的维度，支付矩阵的元素由各策略组合对应的终节点支付决定。但反之不成立：同一个策略型博弈通常可以对应多个不等价的展开型表示，取决于行动顺序和信息结构的设定。因此展开型是比策略型更丰富的描述形式——它包含策略型所不具备的时序和信息细节。这一丰富性在分析承诺（Commitment）、信号传递（Signaling）和声誉（Reputation）等问题时不可替代。

应用领域

展开型博弈是契约理论、产业组织理论和政治经济学中的核心建模工具。在契约理论中，委托人-代理人模型的时序结构（委托人先提出合约，代理人后选择努力水平）天然适合展开型表示。在产业组织中，斯塔克尔伯格模型的领导者-跟随者结构直接对应展开型的两阶段序贯博弈。在政治经济学中，立法过程的议程设置、否决权博弈等均高度依赖展开型框架来分析策略性议程操控。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。