ARTICLE

扩展形式博弈

扩展形式博弈 (Extensive-form Game) 扩展形式博弈(extensive-form game)是博弈论中描述序贯决策(sequential decision-making)的核心框架。与策略形式博弈(strategic/normal-form game)将策略压缩为一次性同时选择不同,扩展形式用博弈树(game tree)显式地刻画谁在何时

浏览 4 更新 2025-12-15

扩展形式博弈 (Extensive-form Game)

扩展形式博弈(extensive-form game)是博弈论中描述序贯决策(sequential decision-making)的核心框架。与策略形式博弈(strategic/normal-form game)将策略压缩为一次性同时选择不同,扩展形式用博弈树(game tree)显式地刻画谁在何时、知道什么、可做什么、以及最终各方得到什么收益。这一表示法由冯·诺依曼奥斯卡·摩根斯坦在《博弈论与经济行为》(1944)中奠基,后经莱因哈德·泽尔腾(Reinhard Selten)引入子博弈精炼概念而完善。

博弈树的构成要素

一棵扩展形式博弈的博弈树由以下要素构成:

  1. 节点(nodes):每个非终结点代表某个参与者的决策时刻,终结点(terminal node)则对应博弈结束,其上标注各参与者的收益向量。
  2. (edges):从节点出发的各条边代表该参与者当前可选的行动。
  3. 参与者分配(player assignment):每个非终结点恰好指派给一个参与者,表明由谁在该点做决策。
  4. 信息集(information set):将外观上不可区分的节点划入同一信息集,表示当事人在做决策时无法分辨自己处于信息集中的哪一个具体节点。
  5. 自然(nature/chance):外部随机事件被视为虚拟参与者"自然",在对应节点按已知概率分布随机选择。

完美信息与不完美信息

当每一个信息集都只包含一个节点——即每个参与者在行动时完全知晓此前所有已发生的行动——该博弈具有完美信息(perfect information)。国际象棋、围棋等回合制完全透明博弈属于此类。反之,若至少存在一个信息集包含多个节点,则称为不完美信息(imperfect information),典型的例子包括扑克牌中对手手牌未知的情形,以及企业间同时定价时一方无法观测另一方本期决策的序贯市场博弈。不完美信息的存在使得参与者必须基于信念(belief)进行推断,从而将贝叶斯推理引入动态博弈分析。

策略与均衡概念

在扩展形式中,一个参与者的策略(strategy)是在其每一个信息集上都规定一个行动选择的完整计划——即使某些信息集在实际博弈路径上不会到达,策略也必须涵盖。这一定义远较策略形式的"选一行"更精细,也是扩展形式分析力的来源。

标准的纳什均衡在扩展形式中可能包含不可置信的威胁(non-credible threat)。考虑一个简单的市场进入博弈:在位者在进入发生后宣称"若你进入我就打价格战"。若仅检验策略组合是否为纳什均衡,这一威胁看似有效——进入者若相信威胁则不该进入。但一旦进入已成事实,在位者理性地选择"默许"优于"血战",则该威胁不可置信。为了排除此类空谈,泽尔腾提出了子博弈精炼纳什均衡(subgame perfect Nash equilibrium, SPNE),要求均衡策略在每一个子博弈上也构成纳什均衡——换言之,无论博弈路径偏离到何处,均衡所规定的后续行为都必须保持理性。在完美信息有限博弈中,SPNE 可通过逆向归纳法(backward induction)唯一确定(当没有平局时)。

逆向归纳法

逆向归纳法是求解完美信息有限扩展形式博弈的基本算法:

  1. 从博弈树的终结点出发,找到所有"紧邻终点"的决策节点。
  2. 在每个这样的节点上,该参与者在给定后续无更多决策的前提下,选择最大化自身收益的行动。
  3. 将该节点的结果"折叠"为节点上标定的收益向量,向上传递到前一层节点。
  4. 重复步骤 2--3,直至到达博弈的根节点,得到子博弈精炼均衡路径。

逆向归纳法的直观吸引力在于它体现了序贯理性(sequential rationality):任何时点的决策都基于对未来的正确预期。但其经典困境——蜈蚣博弈(centipede game)——也暴露了其脆弱性:在理性参与者都知道双方均为理性的假设下,逆向归纳迫使双方在第一回合就结束博弈,而实验证据表明真人参与者通常合作多轮。这引发了关于"理性共同知识"假设边界的广泛讨论。此外,当博弈规模巨大(如国际象棋)或存在多个均衡时,逆向归纳的计算可行性和选择唯一性也面临实际挑战。

信息集与不完全信息扩展

当博弈包含不完全信息(incomplete information,即参与者对他人收益函数或类型不确定)时,约翰·海萨尼(John Harsanyi)提出了一种巧妙的转化:引入"自然"在博弈开始时按先验分布抽取参与者的类型,每个参与者知晓自己的类型但不知他人类型,从而将不完全信息博弈转化为不完美信息博弈。这一海萨尼转换(Harsanyi transformation)使得扩展形式能够统一处理完全信息与不完全信息、完美信息与不完美信息四种组合下的动态博弈,为完美贝叶斯均衡(perfect Bayesian equilibrium)和后续的精炼体系铺平了道路。

对经济学的意义

扩展形式博弈为经济学中大量序贯互动现象提供了自然的建模语言:斯塔克尔伯格寡头模型中先行者与后行者、委托-代理模型中合约设计与激励相容、讨价还价博弈(如鲁宾斯坦模型)中交替出价的动态、声誉模型中重复博弈的信念更新、以及中央银行货币政策的时间不一致性问题,都依赖扩展形式来刻画承诺、时序与信息结构的关键作用。可以说,不理解扩展形式,便无以理解现代微观经济理论中关于可信承诺(commitment)、信号传递(signaling)与筛选(screening)的整套分析框架。

\vspace{0.5em} 策略形式博弈 \quad\textperiodcentered\quad 纳什均衡 \quad\textperiodcentered\quad 子博弈精炼均衡 \quad\textperiodcentered\quad 逆向归纳法 \quad\textperiodcentered\quad 信息集 \quad\textperiodcentered\quad 不完全信息博弈 \quad\textperiodcentered\quad 海萨尼转换 \quad\textperiodcentered\quad 蜈蚣博弈