ARTICLE

extensive form games

展开型博弈 (Extensive Form Games) 展开型博弈(Extensive Form Game),又称扩展式博弈,是博弈论中用于描述序贯决策(Sequential Decision Making)的标准建模框架。与策略型博弈(Strategic/Normal Form)将参与人的策略压缩为同时选择不同,展开型通过博弈树(Game Tree)显式

浏览 0 更新 2025-10-29

展开型博弈 (Extensive Form Games)

展开型博弈(Extensive Form Game),又称扩展式博弈,是博弈论中用于描述序贯决策(Sequential Decision Making)的标准建模框架。与策略型博弈(Strategic/Normal Form)将参与人的策略压缩为同时选择不同,展开型通过博弈树(Game Tree)显式刻画参与人的行动顺序、每一步可用的选择以及各参与人在决策时掌握的信息,因此天然适用于分析具有先后次序的互动情景。

博弈树的基本构成

展开型博弈由以下基本要素组成:

  1. 节点(Nodes):分为决策节点(Decision Nodes)和终节点(Terminal Nodes)。每个决策节点标注当前行动的参与人,终节点标注各参与人的支付(Payoffs)。
  2. (Edges/Branches):从决策节点出发的每条边代表该参与人在该时点可选择的行动。
  3. 信息集(Information Sets):将参与人无法区分的决策节点划入同一虚线框。若参与人在该集合中不知道自己所处的精确节点,则该信息集为非单点信息集(Non-singleton),此时博弈具有不完美信息(Imperfect Information)。
  4. 参与人函数:将每个决策节点映射到对应的参与人。
  5. 支付函数:将每个终节点映射到各参与人的效用向量。

展开型博弈的图示即为博弈树。博弈树的根表示博弈开始,从根到任一终节点的路径构成一个博弈路径(Play),每一条完整路径对应一种可能的博弈结果。

完美信息与不完美信息

若展开型博弈中所有信息集都是单点的(即每个参与人在每次行动时都完全知晓博弈此前发生的全部历史),则称该博弈具有完美信息(Perfect Information)。否则,称该博弈具有不完美信息(Imperfect Information)。需要区分的是,不完美信息不等同于不完全信息(Incomplete Information)——前者涉及对历史行动的不确定,后者涉及对他人类型(如支付函数参数)的不确定。Harsanyi将不完全信息博弈转化为不完美信息博弈的框架称为Harsanyi变换(Harsanyi Transformation)。

纯策略与行为策略

在展开型博弈中,纯策略(Pure Strategy)为每个信息集指定一项行动的完整计划,即使某些信息集在均衡路径上可能无法到达。策略的数量随信息集数量呈指数增长。与之相对,行为策略(Behavioral Strategy)在每个信息集上独立地随机化行动选择。Kuhn定理指出,在具有完美回忆(Perfect Recall)的展开型博弈中,混合策略与行为策略是等价的——即任何混合策略的支付分布均可由行为策略复制。完美回忆要求参与人永不遗忘自己曾知道的信息或曾采取的行动。

子博弈与子博弈完美均衡

展开型博弈的一个核心分析工具是子博弈(Subgame)。子博弈从一个单点信息集开始,包含该节点及其所有后继节点,并且不能切割任何信息集。基于子博弈概念,子博弈完美纳什均衡(Subgame Perfect Nash Equilibrium, SPNE)将纳什均衡精炼为:不仅在原博弈的均衡路径上每个参与人的策略是最优反应,在每一个子博弈中也必须构成纳什均衡。SPNE排除了依赖不可信威胁(Non-credible Threat)的纳什均衡,是分析序贯理性(Sequential Rationality)的基础解概念。

反向归纳法

对于有限完美信息展开型博弈反向归纳法(Backward Induction)提供了一种构造子博弈完美均衡的算法。从博弈树的终节点向上逐层求解:在每一个决策节点处,给定后继节点的均衡支付,当前参与人选择最大化自身支付的行动。由于完美信息保证每个信息集均为单点,反向归纳法可唯一确定均衡路径(若不出现支付相同的平局情况)。Zermelo定理指出,任何有限完美信息零和博弈都具有唯一的反向归纳解。

反向归纳法的前提假设——所有参与人是理性且共同知识——在长博弈中受到理论和实验的挑战。著名的蜈蚣博弈(Centipede Game)实验中,参与人通常在较早阶段就终止博弈,偏离反向归纳法的预测,揭示了有限理性与互惠偏好的重要性。

与策略型博弈的关系

任何展开型博弈都可转换为策略型博弈,方法是将每个参与人的纯策略枚举为策略空间中的维度,支付矩阵的元素由各策略组合对应的终节点支付决定。但反之不成立:同一个策略型博弈通常可以对应多个不等价的展开型表示,取决于行动顺序和信息结构的设定。因此展开型是比策略型更丰富的描述形式——它包含策略型所不具备的时序和信息细节。这一丰富性在分析承诺(Commitment)、信号传递(Signaling)和声誉(Reputation)等问题时不可替代。

应用领域

展开型博弈是契约理论产业组织理论政治经济学中的核心建模工具。在契约理论中,委托人-代理人模型的时序结构(委托人先提出合约,代理人后选择努力水平)天然适合展开型表示。在产业组织中,斯塔克尔伯格模型的领导者-跟随者结构直接对应展开型的两阶段序贯博弈。在政治经济学中,立法过程的议程设置、否决权博弈等均高度依赖展开型框架来分析策略性议程操控。