ARTICLE

序贯均衡

序贯均衡 (Sequential Equilibrium) 序贯均衡（Sequential Equilibrium）是由 Kreps 和 Wilson 于1982年在《Econometrica》上发表的论文《Sequential Equilibria》中提出的博弈论均衡精炼概念。序贯均衡将子博弈精炼纳什均衡（SPNE）的精炼逻辑——即剔除不可信威胁——从完美

浏览 0 更新 2026-01-15

序贯均衡 (Sequential Equilibrium)

序贯均衡（Sequential Equilibrium）是由 Kreps 和 Wilson 于1982年在《Econometrica》上发表的论文《Sequential Equilibria》中提出的博弈论均衡精炼概念。序贯均衡将子博弈精炼纳什均衡（SPNE）的精炼逻辑——即剔除不可信威胁——从完美信息博弈推广至不完美信息博弈，要求在每个信息集上，给定参与人的信念，其策略都是最优的。序贯均衡由一对要素构成：一个行为策略组合（Behavioral Strategy Profile） $\sigma$ 和一个信念系统（Belief System） $\mu$ ，二者必须同时满足序贯理性（Sequential Rationality）和一致性（Consistency）两个条件。

动机：为何需要序贯均衡

在完全信息序贯博弈中，子博弈精炼纳什均衡足以排除依赖空洞威胁的纳什均衡。然而，当博弈存在不完美信息（即博弈树中存在多节点信息集）时，许多信息集并不构成子博弈的根节点——因为它们不是单节点信息集。这使得子博弈精炼在这些信息集上完全没有任何约束力。例如，在 Spence 信号传递博弈中，接收者在接收到信号后所处的信息集通常包含多个节点（对应发送者的不同私人类型），严格意义上的子博弈并不存在，SPNE 退化为纳什均衡，无法发挥任何甄别作用。序贯均衡通过引入信念系统和一致性要求，填补了这一关键空白。

形式定义

设 $\Gamma$ 为一个有限扩展型博弈。一个评估（Assessment） $(\sigma, \mu)$ 由以下两部分构成：

行为策略组合 $\sigma = (\sigma_1, \dots, \sigma_N)$ ：对每个参与人 $i$ 和每个信息集 $h \in H_i$ ， $\sigma_i(\cdot \mid h)$ 是 $h$ 上可行行动集上的概率分布。
信念系统 $\mu$ ：对每个信息集 $h$ ， $\mu(\cdot \mid h)$ 是 $h$ 中节点上的概率分布，表示在该信息集行动时，参与人对"自己具体处于哪个节点"的信念。

序贯理性 (Sequential Rationality)

一个评估 $(\sigma, \mu)$ 满足序贯理性，如果对每个参与人 $i$ 和每个信息集 $h \in H_i$ ，在给定信念 $\mu(\cdot \mid h)$ 和其他参与人的策略 $\sigma_{-i}$ 的前提下，参与人 $i$ 在 $h$ 上的策略 $\sigma_i(\cdot \mid h)$ 最大化其从 $h$ 开始的期望收益（延续收益，Continuation Payoff）。换言之，没有任何参与人在任何信息集上有偏离当前策略的动机。

序贯理性本质上是将贝尔曼最优性原则逐信息集地施加于整个博弈树：每个参与人在博弈的任何可能到达之处，都按照事后最优的方式行动。

一致性 (Consistency)

信念系统 $\mu$ 不能是任意指定的——它必须与策略 $\sigma$ 存在内在的逻辑关联。Kreps 和 Wilson 提出的一致性条件要求：存在一列完全混合的行为策略组合 $\{\sigma^k\}_{k=1}^{\infty}$ （即每个行动的概率严格为正）使得：

$\sigma^k \to \sigma$ （逐点收敛）；
$\mu^k \to \mu$ ，其中 $\mu^k$ 是在策略 $\sigma^k$ 下，沿着信息集 $h$ 的到达概率，通过贝叶斯法则（Bayes' Rule）推导出的信念系统。

这一构造的核心在于：一致性要求信念不仅来源于贝叶斯法则，还必须是某种"微小扰动"策略的极限信念。它排除了那些虽然形式满足贝叶斯更新、却缺乏策略收敛基础的"任意"信念。直观上，一致性意味着即使某些信息集在均衡路径上以零概率出现（零概率事件），参与人的信念也必须能够被某个趋于均衡的扰动序列所"理性化"。

与相关均衡概念的关系

子博弈精炼纳什均衡 (SPNE)：在完美信息博弈中，序贯均衡与 SPNE 等价。在不完美信息博弈中，序贯均衡是 SPNE 的真精炼——所有序贯均衡都是 SPNE，但反之不然。
完美贝叶斯均衡 (PBE)：PBE 也要求序贯理性和贝叶斯更新，但其一致性要求较序贯均衡弱。一般而言，每个序贯均衡都是 PBE，但 PBE 不一定是序贯均衡。序贯均衡通过"扰动序列收敛"的一致性条件排除了某些 PBE 中贝叶斯规则无法确定（即信念任意）时的非自然信念。
颤抖手完美均衡 (Trembling-Hand Perfect Equilibrium)：Selten 在策略型博弈中定义的颤抖手完美均衡与序贯均衡密切相关。Kreps 和 Wilson 证明了在"几乎所有"博弈中，序贯均衡与策略型颤抖手完美均衡的扩展型对应重合。
存在性：任何有限扩展型博弈至少存在一个序贯均衡。这一存在性定理是序贯均衡理论生命力的根本保障。

信号博弈中的应用

序贯均衡最经典的应用领域是信号博弈（Signaling Game）。在 Spence (1973) 的劳动力市场信号模型中，工人（发送者）拥有关于自身生产率的私人信息，选择教育水平作为信号发送给雇主（接收者）。雇主观察到教育水平后形成关于工人类型的信念，据此提供工资。该博弈通常存在多个 PBE——包括分离均衡（不同生产率选择不同教育水平）和混同均衡（所有类型选择相同教育水平）。序贯均衡通过一致性条件对非均衡路径上的信念施加了结构性约束，排除了某些缺乏直观合理性的混同均衡。具体而言，Cho-Kreps 直观标准（Intuitive Criterion）进一步利用了序贯均衡的信念逻辑，要求接收者在面对非均衡信号时，将信念仅赋予那些"可能从该偏离中获益"的类型。

经济学含义与局限

序贯均衡深刻型塑了现代信息经济学的分析范式。从产业组织理论中的限制定价（Limit Pricing）和掠夺性定价，到公司金融中的股利信号和资本结构信号，再到宏观经济学中的中央银行声誉与货币政策信号（Barro-Gordon模型），序贯均衡为理解不完全信息下的策略互动提供了严谨且统一的分析语言。

然而，序贯均衡也面临若干批评与局限：（1）一致性条件在无限博弈或连续行动空间中不易推广；（2）存在性定理仅适用于有限博弈；（3）均衡多重性问题仍然严重，一个博弈可能拥有众多序贯均衡，需借助直觉标准等进一步精炼；（4）实证层面，序贯均衡假设参与人具有无限推理能力和共同知识，这在行为博弈论的实验证据中常遭质疑。尽管如此，序贯均衡仍是现代博弈论在精炼之路上最深刻、最具影响力的概念贡献之一。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。