ARTICLE
反向归纳法
反向归纳法 (Backward Induction) 反向归纳法是博弈论/决策理论求解动态博弈的核心法→"从后向前":从最后一阶段最优化选择开始倒推至起点→形成子博弈精炼纳什均衡(SPNE)。适用:完全信息序贯博弈(所有参与者知博弈完整结构+轮到行动时可观此前一切)。 求解步骤 1定位终末决策节点→2确定最后一步最优行动(最大化支付→最后一步无后续→选择直接
反向归纳法 (Backward Induction)
反向归纳法是博弈论/决策理论求解动态博弈的核心法→"从后向前":从最后一阶段最优化选择开始倒推至起点→形成子博弈精炼纳什均衡(SPNE)。适用:完全信息序贯博弈(所有参与者知博弈完整结构+轮到行动时可观此前一切)。
求解步骤
1定位终末决策节点→2确定最后一步最优行动(最大化支付→最后一步无后续→选择直接)。3剪枝:最优行动替换该节点为对应支付("剪去"非选分支)。4后移一步→5重复:参与者预期下一阶段对手最优选择→选使总支付最大的行动。6持续倒推至根节点→根开始沿最优路径连完整行动序列=解。
蜈蚣博弈
两玩家轮流:拿取(博弈结束)或传递(金额增+对手轮)。4回合例:初始\$2,每次传增\$2。支付:①P1:拿(2,0)/传→②P2:拿(1,3)/传→③P1:拿(4,2)/传→④P2:拿(3,5)。
倒推:④P2必拿→P1若传至④得3;③P1:拿得4>传得3→拿;②P2知P1③拿→传得2<拿得3→拿;①P1知P2②拿→传得1<拿得2→第1回合即拿→(2,0)。
蜈蚣博弈悖论:理论预一回合结束,但实验经济学现实中人多传递数回合欲合作→揭示理性的共同知识假设的现实局限(不绝对信任对手理性、或含利他主义等社会偏好)。
理论意义
反向归纳→SPNE主要工具。子博弈:博弈树单节信息集起含其后全部分。SPNE要求每子博弈皆纳什均衡→反向归纳排不可信威胁(例市场进入→在位威胁价战→若价战自毁→威胁不可信→容忍为最优→被排除)。
应用:经济学:寡头垄断序贯决策(斯塔克尔伯格模型)、劳资谈判、拍卖/合同设计;金融学:美式期权定价(每时点"立即行权vs继续持有"→即反归纳→动态规划基础);政治学:立法投票/危机处理;AI:棋类博弈树Minimax算法。
局限:理性的共同知识强假设难成立;博弈树分支多/时间线长→"维度灾难";信息不完全/不对称→需贝叶斯纳什均衡/精炼贝叶斯均衡。