ARTICLE

扩展式博弈

扩展式博弈 (Extensive-Form Game) 扩展式博弈(Extensive-Form Game)是博弈论 (Game Theory) 中用于描述具有时间顺序和信息结构的互动决策问题的基本建模工具。与标准式博弈 (Normal-Form Game) 用矩阵同时刻画所有参与者的策略不同,扩展式博弈通过博弈树 (Game Tree) 直观展示参与者轮流

浏览 2 更新 2025-10-26

扩展式博弈 (Extensive-Form Game)

扩展式博弈(Extensive-Form Game)是博弈论 (Game Theory) 中用于描述具有时间顺序信息结构的互动决策问题的基本建模工具。与标准式博弈 (Normal-Form Game) 用矩阵同时刻画所有参与者的策略不同,扩展式博弈通过博弈树 (Game Tree) 直观展示参与者轮流行动的过程、每个决策节点上可获得的信息,以及随机事件(自然)对结果的影响。这一表述方式由冯·诺依曼 (John von Neumann) 和摩根斯坦 (Oskar Morgenstern) 在1944年的奠基著作《博弈论与经济行为》中系统引入,后经库恩 (Harold W. Kuhn) 在1953年的经典论文中予以严格形式化,形成了今天使用的标准定义。

基本构成要素

一个完整的扩展式博弈包含以下核心要素:

  1. 参与者集合 (Players):决策主体,包括一个特殊角色——自然 (Nature),它不追求自身收益,仅按照已知概率分布随机选择行动。
  2. 博弈树 (Game Tree):由节点 (Nodes) 和枝干 (Branches) 构成的有向树。决策节点 (Decision Nodes) 表示某参与者必须做出选择的时刻;终点节点 (Terminal Nodes) 代表博弈结束,其后标注各参与者的收益 (Payoffs)。
  3. 行动与枝干 (Actions \& Branches):从每个决策节点出发的每条枝干代表该参与者在该节点可选的行动 (Action),每个节点至少有两个行动(主动选择或自然随机)。
  4. 信息集 (Information Sets):将决策节点划分成若干信息集,每个信息集中的节点对参与者而言是不可区分的。这一概念是刻画不完全信息的关键。若每个信息集只包含一个节点,称该博弈具有完美信息 (Perfect Information);若至少有一个信息集包含多个节点,则为不完美信息 (Imperfect Information)。
  5. 策略 (Strategy):参与者的一个完整行动计划,规定了其在每一个属于他的信息集上选择何种行动。注意策略与行动的区别:行动是单次选择,策略是全局性的规则。
  6. 收益函数 (Payoff Function):在每个终点节点处为每位参与者赋予一个效用值(通常用实数表示)。

扩展式与标准式的等价性

每一个有限的扩展式博弈都可以唯一地转化为一个标准式博弈:方法是为每位参与者列出其所有可能的策略,并根据博弈树的路径计算每种策略组合对应的收益向量。然而,这种转化会丧失博弈的时序与信息结构信息。标准式博弈无法区分一个扩展式博弈中策略承诺的时间顺序和信息集划分的精细程度,而这些信息对于分析可信承诺 (Credible Commitment) 和动态一致性 (Dynamic Consistency) 至关重要。因此,对于存在先后次序的互动决策问题,直接使用扩展式表述进行分析更为合适。

子博弈完美均衡

扩展式博弈中最核心的解概念是子博弈完美均衡 (Subgame Perfect Equilibrium, SPE),由莱因哈德·泽尔腾 (Reinhard Selten) 在1965年提出。子博弈完美均衡是对纳什均衡的精炼——它要求所有参与者的策略不仅在整个博弈中构成纳什均衡,而且在博弈树的每一个子博弈 (Subgame) 中也构成纳什均衡。一个子博弈是从某个单一决策节点出发、包含其所有后续节点且不切割任何信息集的最大连通子图。

子博弈完美均衡的核心价值在于剔除不可信的威胁。在标准式纳什均衡中,参与者可以承诺在博弈的某些分支上采取对自己不利但可以威慑对手的行动;而在扩展式框架下,子博弈完美均衡要求这些承诺在实际行动时必须是最优的,从而排除了空头威胁 (Empty Threats)。求解子博弈完美均衡的标准方法是逆向归纳法 (Backward Induction):从最后一个决策节点开始,选择该节点参与者的最优行动,将其收益代入前一个决策节点,逐层倒推至初始节点。逆向归纳法的逻辑基础是理性共识 (Common Knowledge of Rationality)——每位参与者都知道所有参与者都是理性的,且每个人都清楚所有人都知道这一点。

不完全信息扩展式博弈

当参与者在某些决策节点上不清楚博弈的历史或对手的类型时,博弈便具有不完全信息 (Incomplete Information)。这一情形由约翰·海萨尼 (John Harsanyi) 在1967-68年的三篇系列论文中通过引入海萨尼转换 (Harsanyi Transformation) 予以处理:将关于参与者私人类型的未知信息转化为自然在博弈初始阶段的随机选择,从而将不完全信息博弈转化为不完美信息的完全信息博弈。转换后的博弈使用完美贝叶斯均衡 (Perfect Bayesian Equilibrium, PBE) 作为解概念,它结合了子博弈完美均衡的序贯理性要求和贝叶斯信念更新规则。在PBE中,参与者在每个信息集上都有一个关于自己处于该信息集中不同节点的信念 (Belief),且这些信念通过贝叶斯法则 (Bayes' Rule) 与先前的策略保持一致。

应用领域

扩展式博弈在经济学和社会科学中有广泛的应用。在产业组织中,它被用于分析斯塔克尔伯格模型 (Stackelberg Model) 中的产量领导博弈、进入遏制 (Entry Deterrence) 策略以及价格竞争的时序动态。在政治学中,扩展式博弈被用于建模竞选策略立法博弈以及国际冲突中的信号传递和威慑。在实验经济学中,最后通牒博弈 (Ultimatum Game)、信任博弈 (Trust Game) 和序贯囚徒困境等经典实验,都使用扩展式框架来设计实验和分析人类行为偏离完全理性假设的规律。行为博弈论 (Behavioral Game Theory) 进一步拓展了这一框架,研究有限理性、社会偏好和认知层次在动态互动中的表现。扩展式博弈提供的结构框架,使研究者能够精确描述信息流动、时序约束和策略互动,是理解动态经济问题的不可替代的分析工具。