ARTICLE
Sequential Equilibrium
序贯均衡(Sequential Equilibrium)是扩展式博弈中纳什均衡的精炼概念,由克雷普斯(David M. Kreps)与威尔逊(Robert Wilson)于1982年提出。序贯均衡要求博弈参与者在每一个信息集上都基于"一致性"信念做出序贯理性决策,从而将子博弈完美均衡的思想推广到非完美信息博弈。该概念是现代非合作博弈理论的核心工具,广泛应用于
序贯均衡(Sequential Equilibrium)是扩展式博弈中纳什均衡的精炼概念,由克雷普斯(David M. Kreps)与威尔逊(Robert Wilson)于1982年提出。序贯均衡要求博弈参与者在每一个信息集上都基于"一致性"信念做出序贯理性决策,从而将子博弈完美均衡的思想推广到非完美信息博弈。该概念是现代非合作博弈理论的核心工具,广泛应用于产业组织、信息经济学、金融契约理论及政治学中的信号博弈与廉价谈话博弈。
1. 基本定义
1.1 信念系统与评估
序贯均衡由两个要素构成:一个策略组合(Strategy Profile)和一个信念系统(Belief System)。信念系统 为每一个信息集 赋予一个关于该信息集中各决策节点概率的分布,即 ,表示参与者在到达信息集 时对历史路径的主观概率判断。一组策略 与信念 共同构成一个评估(Assessment),它是序贯均衡的原始载体。
1.2 序贯理性
评估 满足序贯理性(Sequential Rationality),当且仅当在每一个信息集 上,持有该信息集所对应信念 的参与者在面对其他参与人的后续策略时,其当前策略是最优的。换言之,不存在任何一个信息集,参与者可以通过单方面偏离策略而在该信息集上获得更高的期望收益。序贯理性比子博弈完美均衡更强,因为它要求在最细粒度的信息层次上——甚至是在零概率到达的信息集上——策略都必须是最优的。
1.3 信念一致性
信念系统 称为一致的(Consistent),如果存在一组完全混合策略序列(即每个信息集的每个行动都被赋予严格正概率的策略组合),满足:(i) 逐点收敛;(ii) 由 通过贝叶斯法则导出的信念序列 收敛于 。一致性条件确保信念的更新并非任意设定,而是某种"逼近极限"过程的产物。完全混合策略保证贝叶斯法则在每一个信息集上都有定义,即使零概率事件也可以作为若干正概率策略序列的极限来赋予意义。
2. 与相关均衡概念的关系
2.1 子博弈完美均衡
子博弈完美均衡(Subgame Perfect Equilibrium)是序贯均衡在特殊情形下的简化版本。当博弈具有完美信息结构——即每一个信息集都是单节点集——时,序贯均衡等价于子博弈完美均衡。在非完美信息博弈中,子博弈完美均衡仅在真正的子博弈上施加理性约束,而序贯均衡强调在所有信息集上的条件最优性。例如,在信号博弈中,发送者的每一类类型都在其信息集上选择最优信号,接收者在观察到信号后根据贝叶斯信念做出最优反应——这正是序贯均衡的典型应用场景。
2.2 完美贝叶斯均衡
完美贝叶斯均衡(Perfect Bayesian Equilibrium, PBE)是序贯均衡的一个更常用的变体。两者都要求信念由贝叶斯法则更新,但一致性条件不同:PBE要求"在均衡路径上信念由贝叶斯法则确定",对非均衡路径上的信念仅要求无矛盾性;序贯均衡则要求整个信念系统(包括非均衡路径)都是一致性极限的产物。在大多数标准博弈(如信号博弈、廉价谈话博弈)中,序贯均衡与PBE的集合相同,但在某些具有复杂非均衡路径结构的博弈中,序贯均衡的约束更强。因此,序贯均衡被公认为理论上更干净的定义。
2.3 颤抖手完美均衡
颤抖手完美均衡(Trembling Hand Perfect Equilibrium)是序贯均衡的先驱概念,由塞尔腾(Selten, 1975)提出。两者都通过考虑"颤抖"(trembles)——即参与者以极小概率犯错——来精炼均衡。区别在于:颤抖手完美均衡要求策略本身是某种完全混合策略序列的极限,且每个参与者的策略在所有对手的颤抖下都是最优的;序贯均衡则将颤抖的极限应用于策略和信念两个维度,信念的一致性直接来自颤抖序列的贝叶斯更新。在一些博弈中,序贯均衡的集合可能略大于颤抖手完美均衡。
3. 数学形式化
3.1 形式定义
令 为一个有限扩展式博弈。序贯均衡 需满足以下两个条件:
定义1(序贯理性): 对于每一个参与人 和每一个信息集 ,有:
其中 为参与人 的收益函数,条件期望依赖于信念 。
定义2(一致性): 存在一个完全混合策略序列 (即对每个信息集上的每个行动, 赋予严格正概率),使得 ,且由 通过贝叶斯法则导出的信念序列 收敛于 。
3.2 一致性的几何解释
一致性条件等价于要求信念 属于"由完全混合策略诱导的信念集合的闭包"。从拓扑学角度看,设 为完全混合策略的空间,映射 将每个完全混合策略映射为其贝叶斯信念。则 是一致的当且仅当 ,即信念属于该映射值域的闭包。这种定义方式使得序贯均衡成为一个"封闭"的概念——极限点不逃逸到集合之外,从而保证均衡的存在性。
3.3 存在性定理
克雷普斯与威尔逊(1982)证明了:在有限扩展式博弈中,序贯均衡总是存在。证明思路为:首先构造一个辅助的"颤抖博弈"(在其中所有行动均被赋予正概率),该博弈必然存在纳什均衡;然后考虑颤抖强度趋于零的极限序列,利用紧凑性提取收敛子序列,极限点即为原博弈的序贯均衡。由于完全混合策略空间是紧集,上述极限过程总是可行的——这一存在性结果是序贯均衡优于许多更强精炼概念(如颤抖手完美均衡)的重要优势。
4. 应用场景
4.1 信号博弈
信号博弈是序贯均衡最经典的应用场域。在劳动力市场信号模型(Spence, 1973)中,工人的生产能力是私人信息,教育水平是可观察的信号。序贯均衡要求:企业作为接收者,在看到教育水平信号后形成关于工人类型的信念,并据此支付工资;工人作为发送者,在预测企业反应的基础上选择最优教育水平。均衡分为分离均衡(高能力者选高教育以区分自己)、混同均衡(所有类型选相同教育)和半分离均衡。序贯均衡的一致性条件排除了某些在PBE中看似可行但信念不合理的均衡。
4.2 廉价谈话博弈
在廉价谈话(Cheap Talk)博弈中,发送者与接收者之间存在利益冲突,且信号本身无直接成本。克劳福德与索贝尔(Crawford \& Sobel, 1982)的经典模型以序贯均衡为基础。在此类博弈中,存在多重均衡,从完全不沟通的"咿呀"均衡到部分信息传递的有限分区均衡。序贯均衡通过约束信念的一致性来筛选均衡——例如,若发送者发出非均衡信息(偏离既定策略),接收者的信念必须有合理的颤抖基础,不能随意设定。
4.3 动态议价
在动态议价博弈中,序贯均衡刻画了不完全信息下讨价还价的均衡路径。格罗斯曼与佩里(Grossman \& Perry, 1986)关于拒绝后威胁的序贯均衡分析,揭示了在非均衡路径上信念如何影响议价结果。当一方提出要约被拒绝后,拒绝本身传递了关于对方保留价值的信息,信念更新影响后续要约的均衡策略。序贯均衡的一致性条件确保了这类信念更新具有博弈论基础,而非主观臆测。
5. 局限性与延伸
序贯均衡并非完美无缺。首先,一致性条件有时过于严格:在某些博弈中,所有非均衡路径上可接受的信念必须来自相同的颤抖序列,这可能排除某些直观上合理的信念。其次,序贯均衡没有对"颤抖"的结构施加限制——所有颤抖被视为等可能的,但在实际博弈中,参与者犯某些错误的概率可能高于其他错误。为此,后续研究提出了"直观标准"(Intuitive Criterion, Cho \& Kreps, 1987)和"适验均衡"(Divinity Equilibrium)等进一步精炼。此外,对于无穷行动空间的博弈,序贯均衡的存在性不再自动成立,需要额外的连续性假设。
总体而言,序贯均衡是博弈论从静态分析迈向动态分析的重要里程碑。它将信念的"合理性"与策略的"最优性"融为一体,为不完全信息动态博弈提供了一个统一的分析框架。无论是理论研究者还是应用经济学家,理解序贯均衡都是掌握现代博弈论不可或缺的一步。