ARTICLE

完全信息动态博弈

完全信息动态博弈 (Complete Information Dynamic Game) 完全信息动态博弈是博弈论中的一个核心框架，指的是所有参与者的收益函数为共同知识、且参与人按先后顺序行动的博弈。与完全信息静态博弈不同，动态博弈中后行动者能观察到先行者的选择，这一时序结构深刻改变了策略推理的逻辑：理性参与人必须预判对手对自己行动的反应，从而产生子博弈精炼

浏览 0 更新 2026-05-25

完全信息动态博弈 (Complete Information Dynamic Game)

完全信息动态博弈是博弈论中的一个核心框架，指的是所有参与者的收益函数为共同知识、且参与人按先后顺序行动的博弈。与完全信息静态博弈不同，动态博弈中后行动者能观察到先行者的选择，这一时序结构深刻改变了策略推理的逻辑：理性参与人必须预判对手对自己行动的反应，从而产生子博弈精炼纳什均衡、逆向归纳、可信承诺等关键概念。

完全信息动态博弈构成了分析寡头竞争、产业组织、谈判、政治承诺等众多经济现象的理论基石。

扩展式表示与博弈树

动态博弈的标准表示工具是扩展式 (Extensive Form)，通常以博弈树的形式呈现。一棵博弈树包含以下要素：

节点 (Nodes)：代表博弈中可能到达的状态。初始节点（根）表示博弈的起点。
分支 (Branches)：每个非终结点上，行动者从可选行动集中选择一个行动，将博弈引向新的节点。
终结点 (Terminal Nodes)：博弈结束的节点，每个参与人在此获得相应的收益 (Payoff)。
信息集 (Information Sets)：在完全信息博弈中，每个信息集都是单节点——参与人精确知道自己在博弈树中的位置。

不妨以一个简单的两阶段博弈为例：企业E（潜在进入者）先决定"进入"或"不进入"市场，在位者I观察到E的选择后决定"默许"或"价格战"。博弈树清晰地展示了策略互动的时序结构：E的选择位于根节点，I的选择位于E节点的后续节点。这种树状结构是向后求解的基础。

策略与行动的区别：动态博弈的精妙之处

在静态博弈中，参与人的策略等同于其行动——每个参与人只是选择一组行动。但在动态博弈中，策略的内涵远为丰富：一个策略是一份完整的相机行动计划 (Contingent Plan)，它规定了在博弈可能到达的每一个决策节点上参与人将选择的行动。

例如，在上述进入博弈中，在位者I的策略不是单纯的"默许"或"价格战"，而必须同时规定："如果E进入，则选择X；如果E不进入，则选择Y"。即便E不进入时I实际上不需要做出任何选择，但I的策略仍然需要指定这个反事实情境下的行动。

这一区分至关重要，因为纳什均衡仅要求策略组合在均衡路径上没有单方面偏离动机，但可能由不可信的威胁所支撑。完全信息动态博弈的核心洞见，在于它提供了一套工具来剔除这些不可信威胁。

子博弈精炼纳什均衡 (Subgame Perfect Nash Equilibrium, SPNE)

子博弈精炼纳什均衡由莱因哈德·泽尔腾 (Reinhard Selten, 1965) 提出，是动态博弈中最核心的解概念。其定义为：一个策略组合是子博弈精炼纳什均衡，当且仅当它在博弈的每一个子博弈上都构成纳什均衡。

一个子博弈 (Subgame) 是从博弈树中某个单节点信息集开始，包含该节点所有后续节点的子树，且不切割原始博弈中的任何信息集。整个博弈本身也是自身的一个子博弈。

SPNE要求均衡策略不仅在整体博弈的均衡路径上是最优反应，而且在博弈树中每一个可能到达的、哪怕是反事实的子博弈中都必须是最优反应。这一条件优雅地排除了依赖不可信威胁的纳什均衡。

逆向归纳法 (Backward Induction)

求解有限完全信息动态博弈的标准方法是逆向归纳法 (Backward Induction)，即从终结点向初始节点倒推：

在终结点之前的最后一层决策节点上，确定该行动者的最优选择（给定该节点已经到达）。
将该最优选择替代原节点，将博弈"折叠"一层。
重复上述过程，直到回溯到初始节点。

根据库恩定理 (Kuhn's Theorem)，任何有限完全信息动态博弈都可以通过逆向归纳法求解，且所得策略组合即为SPNE。如果博弈满足"无人在同一点上无差异"的条件，则SPNE是唯一的。

逆向归纳法与SPNE的结合揭示了动态博弈中可信性 (Credibility) 的核心地位：一个行动要影响对手行为，必须是在到达该节点时对手也真正愿意执行的行动——即对手在该子博弈中的最优反应。

代表性模型与应用

斯塔克尔伯格双寡头模型 (Stackelberg Duopoly)：与古诺模型的同步产量决策不同，斯塔克尔伯格模型中，领导者企业1先选择产量 $q_1$ ，追随者企业2观察到 $q_1$ 后再选择 $q_2$ 。市场价格由总产量 $Q = q_1 + q_2$ 经反需求函数 $P(Q)$ 决定。通过逆向归纳求解：企业2在给定 $q_1$ 下的最优反应函数为 $R_2(q_1)$ ；企业1预见到这一反应，选择 $q_1^*$ 最大化 $\pi_1(q_1, R_2(q_1))$ 。结果，领导者获得不低于古诺均衡的利润，且通常严格更高——这是先动优势 (First-mover Advantage) 的经典体现。

市场进入威慑 (Entry Deterrence)：贝恩-西洛斯-莫迪利亚尼限价理论分析了在位者如何通过事前投资（产能扩张、广告、研发）改变进入博弈的子博弈结构。在位者在进入发生前的投资构成不可逆的沉没成本，从而将原本不可信的"价格战"威胁转化为可置信的承诺。

鲁宾斯坦讨价还价模型 (Rubinstein Bargaining)：两个参与人轮流出价分割一块大小为1的蛋糕。先出价者提议分配方案 $(x, 1-x)$ ；若对手拒绝，则由对手在下一期出价，但蛋糕因贴现因子 $\delta \in (0, 1)$ 而缩水。通过逆向归纳，存在唯一的SPNE：先出价者获得份额 $\frac{1}{1+\delta}$ ，对手获得 $\frac{\delta}{1+\delta}$ 。该模型优美地将谈判结果内生化，表明即使信息完全，谈判也不会即时达成——延迟来自策略互动的时序结构本身。

承诺与可信威胁

动态博弈框架揭示了承诺 (Commitment) 的战略价值。当参与人能够以不可逆的方式预先约束自己的未来选择时，博弈的均衡可能发生结构性变化。承诺的本质是策略性自我设限：通过削减自身在某些子博弈中的可选行动（"自断退路"），改变对手的预期和选择，从而实现更有利的均衡结果。

经典的例子包括：

企业投资超额产能，使自己在面对进入时"别无选择"只能全力生产——将"价格战"从不可信变为可信。
中央银行的独立性安排：将货币政策委托给厌恶通胀的保守派行长，以此向市场承诺低通胀，克服时间不一致性。
交战方焚毁桥梁（"破釜沉舟"），向敌方发出"绝不撤退"的战略信号。

然而，承诺也有其代价：削减了未来的灵活性。当不确定性较高时，保留选择权的期权价值可能超过承诺的战略收益。

与相关概念的关系

完全信息静态博弈：参与人同时行动或互不知晓对方选择，核心解概念为纳什均衡。动态博弈的SPNE是对纳什均衡的精炼——每个SPNE都是纳什均衡，但反之不然。
不完全信息博弈：参与人对彼此收益函数或类型存在私人信息，需要引入贝叶斯纳什均衡和精炼贝叶斯均衡等解概念。完全信息假设在收益结构已知但行动时序重要的情境下更适用。
重复博弈：相同的阶段博弈重复进行。根据无名氏定理，当贴现因子足够高时，重复博弈可支撑远多于单次博弈的合作均衡结果。完全信息动态博弈的单次时序结构为理解重复博弈中的策略推理提供了基础构件。

批判与局限

完全信息动态博弈面临若干挑战：

逆向归纳的悖论：在蜈蚣博弈 (Centipede Game) 等长博弈中，逆向归纳给出的理论预测与实验中被试的实际行为严重背离，引发了关于"共同知识理性"假设极限的深刻讨论。
多重均衡：当博弈中存在无差异节点时，SPNE可能不唯一。产业组织中的某些进入博弈可能同时存在进入均衡和阻挠均衡。
完全信息的强假设：现实中，企业通常不能精确知道竞争对手的成本结构，工人不了解雇主的全部替代选项。将信息不对称纳入动态分析需要更强但也更复杂的不完全信息动态博弈框架。

尽管存在这些局限，完全信息动态博弈仍然为理解策略性互动中的时序逻辑、承诺价值和可信性问题提供了不可替代的理论基准。从企业竞争到国际谈判，从拍卖设计到货币政策，SPNE和逆向归纳构成了经济学家思考动态策略的标准语言。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。