ARTICLE

序贯理性

序贯理性 序贯理性(Sequential Rationality)是博弈论中用于精炼纳什均衡的重要概念,由克雷普斯(David M. Kreps)和威尔逊(Robert Wilson)于1982年在《序贯均衡》("Sequential Equilibria")一文中正式提出。它要求博弈参与者在每一个信息集上,基于其所持有的信念,选择最优行动策略。简言之,即便

浏览 0 更新 2025-12-08

序贯理性

序贯理性(Sequential Rationality)是博弈论中用于精炼纳什均衡的重要概念,由克雷普斯(David M. Kreps)和威尔逊(Robert Wilson)于1982年在《序贯均衡》("Sequential Equilibria")一文中正式提出。它要求博弈参与者在每一个信息集上,基于其所持有的信念,选择最优行动策略。简言之,即便在博弈尚未实际到达的节点上,参与者也不能作出不可置信的威胁或空洞的承诺——博弈树中的每一步都必须是理性的,否则均衡将缺乏可信性。

概念内涵

在扩展式博弈(Extensive-Form Game)中,一个策略组合被称为满足序贯理性,当且仅当对于每一位参与者和每一个信息集而言,该参与者的策略在该信息集上都是其现有信念下的最优反应。这一条件包含三层含义。

第一,全局一致性。 参与者在不同信息集上制定的策略不能相互矛盾。例如,若某参与者在信息集A上选择了向左行动,那么在任何后续信息集中,其策略都必须与这一选择所导致的博弈路径保持一致。全局一致性确保了整个策略体系的内在逻辑自洽。

第二,动态一致性。 参与者在博弈树的每一个节点——包括那些不在均衡路径上的节点——都有动机按照既定策略行动。这意味着参与者不会在博弈中途偏离预先设定的策略,即任何时间点的最优行动都应当与初始计划一致。动态一致性排除了时间不一致性问题(Time Inconsistency),这在宏观经济政策和讨价还价博弈中尤为重要。

第三,信念更新。 参与者会根据贝叶斯规则不断更新对历史路径和对手类型的信念,并在任何信息集上——即便该信息集在均衡路径之外——都能作出合理的推断。信念更新是序贯理性区别于子博弈完美均衡的关键所在:后者只要求策略在完整子博弈上是最优的,而前者进一步将理性约束施加到由信息集连接的所有决策节点上。

从数学形式上看,给定一个扩展式博弈Γ,策略组合σ和一个信念系统μ,称(σ, μ)满足序贯理性,如果对于每一位参与人i和每一个信息集h ∈ Hᵢ,有:参与人i在策略σ下的期望收益不小于其在任何其他可行策略σ'ᵢ下的期望收益,其中期望值按信念μ(h)计算。

与相关概念的关系

序贯均衡

序贯理性是构成序贯均衡(Sequential Equilibrium)的两大要素之一。一个完整的序贯均衡由一组策略和一组信念共同构成,必须同时满足两个条件:(1)策略在给定信念下是序贯理性的;(2)信念在给定策略下是一致的(Consistent),即存在一个完全混合策略的序列,使得相应的条件概率收敛到该信念系统。一致性条件是对贝叶斯规则的推广,它确保了非均衡路径上的信念也具有理论依据。

完美贝叶斯均衡

完美贝叶斯均衡(Perfect Bayesian Equilibrium, PBE)同样要求策略满足序贯理性原则,但在信念一致性条件上较序贯均衡更为宽松。PBE只要求在均衡路径上信念符合贝叶斯规则,而对非均衡路径上的信念没有施加严格的一致性要求。这意味着在PBE框架下,研究人员可以"自由选择"非均衡路径上的信念,只要该信念能够支撑均衡即可。序贯均衡则要求所有信息集上的信念都必须通过某种一致性的逼近过程导出,从而剔除了更多不合理的均衡。

子博弈完美均衡

子博弈完美均衡(Subgame Perfect Equilibrium, SPE)要求策略在每一个子博弈上构成纳什均衡,但仅限于那些始于单节点信息集的子博弈。当信息集包含多个决策节点时(即存在不完全信息),该信息集不构成一个子博弈,因此SPE无法施加任何约束。序贯理性克服了这一局限,将理性条件延伸至每一个信息集,无论其结构如何。

颤抖手完美均衡

颤抖手完美均衡(Trembling-Hand Perfect Equilibrium)从"微小扰动"角度出发,要求策略在存在极小概率犯错时依然保持最优。在有限博弈中,颤抖手完美均衡与序贯均衡在大多数情况下等价,但在无限博弈或连续行动空间中,二者可能出现分歧。

经济应用

序贯理性在经济学的多个分支中均有广泛应用。

产业组织理论。 在分析进入威慑、价格战和掠夺性定价等动态策略行为时,序贯理性确保在位企业无法依赖不可置信的威胁来阻止潜在进入者。一个经典的例子是"连锁店悖论"(Chain-Store Paradox):若在位者在多个市场上面对潜在进入者,仅凭子博弈完美均衡难以解释实际观测到的掠夺性定价行为,而引入序贯理性和声誉效应后,模型预测更加符合现实。

信号博弈。 在劳动力市场信号模型(Spence模型)中,序贯理性要求高能力工人和教育发送者在每一信息集上作出最优选择,从而形成分离均衡或混同均衡。直觉标准(Intuitive Criterion)等精炼方法正是建立在序贯理性基础之上,通过剔除不合理的非均衡路径信念来进一步缩小均衡集。

廉价谈话博弈。 在发送者与接收者的廉价谈话(Cheap Talk)博弈中,序贯理性要求接收者在听到任何消息后——包括那些均衡中不应出现的"偏离消息"——都能据以更新信念并作出最优反应。这直接决定了信息传递的精确程度和均衡的区间特性(在Crawford和Sobel的经典模型中表现为分区均衡)。

动态机制设计。 在动态合约和拍卖设计中,序贯理性要求代理人在每一阶段根据当前掌握的信息诚实地报告类型或执行合约条款。这一约束对最优合约的设计具有重要影响,例如在动态道德风险模型中,委托人的最优激励方案必须保证代理人在每一期都具有如实报告的激励。

政治经济学。 在分析选举竞争、立法博弈和冲突谈判中的动态互动时,序贯理性确保政治参与者在不同阶段(如初选与大选)的策略具有内在一致性,不会因阶段变化而出现非理性的策略逆转。

理论意义

序贯理性从根本上改变了博弈论的分析范式。在克雷普斯和威尔逊提出该概念之前,博弈论学者主要依赖子博弈完美均衡来处理动态博弈中的可信性问题,但子博弈完美均衡的适用范围受限于严格子博弈的存在。序贯理性将理性约束延伸至博弈树的每一个节点,使得分析更加精细和贴近现实。这一概念也为后续的信念精炼理论——如直观标准、Divinity概念和普遍性信念系统(Universal Belief Systems)——奠定了方法论基础。如今,序贯理性已成为当代博弈论的标准分析工具,几乎所有涉及不完全信息的动态博弈模型都会以此作为构建均衡概念的基本前提。

参考文献

  • Kreps, D. M., \& Wilson, R. (1982). Sequential equilibria. *Econometrica*, 50(4), 863–894.
  • Fudenberg, D., \& Tirole, J. (1991). Perfect Bayesian equilibrium and sequential equilibrium. *Journal of Economic Theory*, 53(2), 236–260.
  • Osborne, M. J., \& Rubinstein, A. (1994). *A Course in Game Theory*. MIT Press.
  • Mas-Colell, A., Whinston, M. D., \& Green, J. R. (1995). *Microeconomic Theory*. Oxford University Press.
  • Spence, M. (1973). Job market signaling. *Quarterly Journal of Economics*, 87(3), 355–374.
  • Crawford, V. P., \& Sobel, J. (1982). Strategic information transmission. *Econometrica*, 50(6), 1431–1451.