ARTICLE
子博弈精炼
子博弈精炼 (Subgame Perfection) 子博弈精炼 (Subgame Perfection) 是博弈论中针对纳什均衡在展开型博弈中多重性问题而提出的核心精炼方法,由 Reinhard Selten 于 1965 年首次系统阐述,他因此与 Nash 和 Harsanyi 共享 1994 年诺贝尔经济学奖。子博弈精炼的核心思想是:一个策略组合若要在
子博弈精炼 (Subgame Perfection)
子博弈精炼 (Subgame Perfection) 是博弈论中针对纳什均衡在展开型博弈中多重性问题而提出的核心精炼方法,由 Reinhard Selten 于 1965 年首次系统阐述,他因此与 Nash 和 Harsanyi 共享 1994 年诺贝尔经济学奖。子博弈精炼的核心思想是:一个策略组合若要在序贯博弈中被认为是合理的,它不仅必须在原博弈的均衡路径上构成纳什均衡,还必须在博弈的 每一个子博弈中 都构成纳什均衡。满足这一条件的均衡称为 子博弈完美纳什均衡 (Subgame Perfect Nash Equilibrium, SPNE)。
子博弈的定义与识别
子博弈 (Subgame) 是从原博弈树中截取的一个符合特定规则的局部结构,必须同时满足三个条件:
- 从一个单点信息集(即该参与人确切知道自己所处的节点)开始;
- 包含该节点的所有后继节点,即博弈树中该节点以下的全部分支;
- 不能切割任何信息集:若一个信息集中有任何一个节点被包含于子博弈内,则该信息集中的所有节点必须全部被包含。
原博弈自身也是一个子博弈(从根节点出发的平凡情况)。在完美信息博弈中,每一个决策节点都构成一个子博弈的根节点;而在不完美信息博弈中,只有属于单点信息集的节点才能作为子博弈的根。这意味着不完美信息博弈可用的真子博弈数量可能极少,甚至为零。
精炼逻辑:排除不可信威胁
纳什均衡在展开型博弈中的根本缺陷在于,它允许策略组合依赖 不可信威胁 (Non-credible Threat) 或 不可信承诺 (Non-credible Promise) 来维持均衡。这些威胁在均衡路径上不会被实际执行,只是作为"反事实条件"阻止某些偏离行为。然而,若博弈真正到达了触发威胁的节点,执行威胁就不再符合威胁方的利益——此时威胁的不可信性暴露无遗,均衡在逻辑上瓦解。
子博弈精炼通过要求均衡策略在 所有子博弈——包括那些在均衡路径上根本不会被到达的子博弈——中都构成纳什均衡,从逻辑上排除了不可信威胁。这一要求体现了 序贯理性 (Sequential Rationality) 原则:参与人在博弈的任何时点都依据当前可得信息最大化自身期望效用,不论该时点是否在原定均衡路径上。序贯理性是动态博弈中理性行为的自然延伸,子博弈精炼正是对这一原则的形式化。
反向归纳法:有限完美信息博弈的构造算法
对于有限完美信息博弈,子博弈完美均衡可以通过 反向归纳法 (Backward Induction) 系统性地构造。该算法从博弈树的终节点出发,逐层向上求解:
- 在终节点的直接前驱决策节点处,该参与人比较选择各条边(行动)所到达终节点的支付,选取最大化自身支付的那个行动;
- 将该节点的最优支付值赋予该节点,替代整棵以该节点为根的子博弈(即视作该子博弈已被"求解");
- 重复上述过程,逐层向博弈树的根部推进,直至到达根节点。
Zermelo 定理指出,任何有限完美信息零和博弈都具有唯一的反向归纳解。当支付函数存在平局时,反向归纳法可能产生多条均衡路径,但每条路径都满足子博弈精炼要求。
经典示例:连锁店悖论
连锁店悖论 (Chain Store Paradox) 是 Selten 本人引入的著名例子,用以检验子博弈精炼的直觉合理性。设想一家连锁店在 个城市各有一家门店,每个城市依次出现一个潜在进入者。在每个城市,进入者先决定是否进入,连锁店随后决定是否发动价格战。单城市子博弈中:若进入者不进入,连锁店获垄断利润;若进入发生且连锁店选择容纳,双方瓜分市场;若连锁店选择价格战,双方均受损。
反向归纳的推理链条是:在最后一个城市,进入已成既定事实,连锁店的最优选择是容纳(避免价格战的损失),因此进入者预期不会被打击,选择进入。向前递推,倒数第二个城市的进入者也预期不会遭受打击,同样选择进入。依此类推,所有城市的均衡结果均为进入。子博弈精炼因而预测:即便连锁店宣称将对任何进入发动毁灭性打击,进入者也不会相信这一威胁。
这一结果虽在逻辑上无懈可击,却在直觉上令人不安——连锁店难道不应在早期市场打击进入以建立"强硬"声誉、威慑后来者吗?这一张力直接推动了声誉模型 (Reputation Models) 和不完全信息博弈精炼理论的后续发展。
局限性与更强精炼
子博弈精炼在不完美信息博弈中的精炼力度显著受限。当博弈中包含大量非单点信息集时,可用的真子博弈数量极少,极端情况下只有原博弈本身构成子博弈。此时子博弈精炼退化为普通纳什均衡,完全丧失了筛选能力。为此,博弈论发展出了更强的精炼概念:
- 序贯均衡 (Sequential Equilibrium):由 Kreps 和 Wilson 于 1982 年提出,要求在每个信息集上指定信念 (Beliefs),且策略必须对给定信念序贯理性,信念必须与均衡策略贝叶斯一致。
- 颤抖手完美均衡 (Trembling-Hand Perfect Equilibrium):由 Selten 于 1975 年提出,要求均衡策略在参与人存在极小概率"颤抖"(即随机犯错)时仍是极限最优反应。
这些更强的精炼概念在任意信息集上施加一致性约束,将序贯理性原则推向更深层次。
经济学应用
子博弈精炼是分析序贯决策的标准工具,广泛渗透于现代经济学的诸多领域:
- 产业组织理论:斯塔克尔伯格模型中领导者-跟随者的产量决策天然适合子博弈精炼分析;进入威慑、限价策略、产能承诺等问题的形式化均依赖 SPNE。
- 契约理论:委托-代理模型的时序结构(委托人先提出合约,代理人后选择行动)要求均衡满足子博弈精炼,否则委托人可能依赖不可信惩罚条款。
- 讨价还价理论:Rubinstein 交替出价模型中的子博弈完美均衡预测了唯一且有效率的即时协议,为理解谈判行为提供了理论基准。
- 宏观经济学:动态不一致性 (Dynamic Inconsistency) 问题——政策制定者在事前宣布最优政策但在事后有偏离动机——本质上是子博弈精炼的直接应用:若政策规则不满足 SPNE,则私人部门不会相信政府的承诺。
子博弈精炼不仅是解开动态博弈逻辑的钥匙,更是理解承诺价值、制度设计和声誉机制等现象的理论起点。