ARTICLE

向后归纳法

向后归纳法（Backward Induction）是博弈论中用于求解扩展式博弈（Extensive Form Games）的标准方法。其核心思想是从博弈的最后一个决策节点出发，逆向推理至初始节点：在每个节点上，假设该节点上的参与者选择能够最大化自身收益的行动，然后将该选择所对应的后续路径的收益代入前一阶段继续推理。这一逻辑也被概括为"向前展望，向后推理"（L

浏览 0 更新 2026-05-26

向后归纳法（Backward Induction）是博弈论中用于求解扩展式博弈（Extensive Form Games）的标准方法。其核心思想是从博弈的最后一个决策节点出发，逆向推理至初始节点：在每个节点上，假设该节点上的参与者选择能够最大化自身收益的行动，然后将该选择所对应的后续路径的收益代入前一阶段继续推理。这一逻辑也被概括为"向前展望，向后推理"（Look ahead, reason backward）。向后归纳法产生的策略组合构成子博弈完美纳什均衡（Subgame Perfect Nash Equilibrium, SPNE），后者是对纳什均衡的精炼——它剔除了那些在博弈的某些子博弈中不可信的威胁或承诺。

基本逻辑与操作步骤

向后归纳法要求博弈具有完美信息（Perfect Information），即所有参与者在做出决策时完全了解此前发生的所有行动。操作分为三步：第一，确定博弈的终端节点——即博弈结束的位置，每个终端节点对应一组参与者的收益向量；第二，从最后一个决策节点（即终端节点之前的节点）开始，考察在该节点上有决策权的参与者，该参与者会选择使其自身收益最大化的行动，将该行动对应的收益向量保留为该节点的"价值"；第三，逆向逐阶段重复上述过程，每一阶段都将后续阶段的最优选择及其收益代入当前节点。最终，从初始节点到终端节点的整条路径即构成向后归纳法的解。

这一过程的数学本质是动态规划（Dynamic Programming）——每个子博弈的解被递归地嵌入更大博弈的分析之中。贝尔曼最优化原理构成了向后归纳法的理论根基：无论初始状态和初始决策如何，剩余决策必须针对前一决策所导致的状态构成最优策略。

与纳什均衡的关系

并非所有纳什均衡都能通过向后归纳法获得。纳什均衡仅要求策略组合在全局范围内相互最优回应，但不排除其中包含在偏离均衡路径上不可信的威胁。例如在进入威慑博弈中，在位者威胁"若进入则发动价格战"，但若该价格战会使在位者自身也遭受损失，则该威胁在真正的子博弈中并非最优选择。向后归纳法排除这类空头威胁，只保留那些在每个子博弈中都能自我实施的策略组合。

向后归纳法产生的均衡在有限完美信息博弈中总是存在且往往唯一。库恩定理（Kuhn's Theorem）确保了有限扩展式博弈中向后归纳解的存在性。然而，当出现收益无差异时，可能存在多条向后归纳路径，此时需要引入进一步的精炼概念如颤抖手完美均衡（Trembling Hand Perfect Equilibrium）来加以区分。

经典应用

寡头市场中的斯塔克尔伯格模型（Stackelberg Model）是向后归纳法的典型应用。在序列博弈中，领导者先行选择产量，追随者在观察到领导者的产量后选择自己的最优产量。追随者的最优反应函数由利润最大化的一阶条件给出；领导者将这一反应函数代入自己的利润函数后选择产量，从而获得先动优势。该模型的解恰好是由向后归纳法得到的子博弈完美纳什均衡。

讨价还价理论是另一重要应用领域。鲁宾斯坦（Rubinstein, 1982）的无限期轮流出价模型利用向后归纳法推导出唯一的子博弈完美均衡：在双方具有不同耐心程度的情况下，较早的出价方能够获得更大的剩余份额。均衡结果依赖于贴现因子的相对大小——贴现因子越大（即越有耐心）的一方在讨价还价中占据优势。

蜈蚣博弈（Centipede Game）则揭示了向后归纳法的一个著名悖论。在该博弈中，向后归纳法预测第一个参与者在第一回合就会选择"结束"而立即终止博弈，但直觉上双方如果选择"继续"直至末尾再"结束"会获得更高收益。这一理论与现实行为的差异引发了关于共同知识（Common Knowledge）和理性假设的深入讨论。实验经济学研究表明，真实参与者在蜈蚣博弈中往往不会完全按照向后归纳法行动，而是表现出一定程度的合作倾向，这说明向后归纳法虽具备逻辑严密性，但在描述实际人类行为方面存在局限性。

局限与批评

向后归纳法依赖一系列严格的假设前提。首先，它要求参与者具有完全理性和无限推理能力，能够准确推测所有后续阶段的均衡行动——当博弈树较大或复杂程度较高时，这一要求的现实性存疑。其次，它假设参与者之间存在关于理性的共同知识：每个人不仅自己是理性的，而且知道其他人也是理性的，如此无限递推。一旦这一假设被放松，均衡结果可能发生显著变化。再次，向后归纳法对收益比较的细微差异高度敏感——微小收益变化可能完全改变倒推结果，这在某些经济模型中导致结论缺乏稳健性。

在不完全信息博弈中，向后归纳法不再直接适用，此时需要使用贝叶斯纳什均衡或精炼贝叶斯均衡（Perfect Bayesian Equilibrium）等更为复杂的解概念。哈萨尼转换（Harsanyi Transformation）通过在博弈开始时引入虚拟"自然"节点来决定参与者的类型，将不完全信息博弈转化为不完美信息的完全信息博弈，从而为这类博弈的求解提供了基础框架。

尽管存在上述局限，向后归纳法仍然是博弈论中最为基础且应用最广的分析工具之一。它不仅为序列博弈提供了清晰的求解路径，也为理解承诺、威胁、信誉等策略性概念提供了严格的逻辑基础。从产业组织理论到政治经济学，从合同理论到国际关系，向后归纳法都为分析具有时间维度的策略互动问题提供了不可或缺的方法论支撑。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。