ARTICLE

Perfect Bayesian Equilibrium

完美贝叶斯均衡 (Perfect Bayesian Equilibrium) 完美贝叶斯均衡(PBE)→博弈论核心均衡概念→Kreps \& Wilson(1982)提出→融子博弈完美均衡(SPE)+贝叶斯更新→核心解不完全信息动态博弈。PBE要求:各信息集上→参与者据所观行动以贝叶斯法则更新信念→给定信念→策略序贯理性(sequential rationa

浏览 0 更新 2025-11-21

完美贝叶斯均衡 (Perfect Bayesian Equilibrium)

完美贝叶斯均衡(PBE)→博弈论核心均衡概念→Kreps \& Wilson(1982)提出→融子博弈完美均衡(SPE)+贝叶斯更新→核心解不完全信息动态博弈。PBE要求:各信息集上→参与者据所观行动以贝叶斯法则更新信念→给定信念→策略序贯理性(sequential rationality)→且信念与均衡策略在均衡路径上一致。

背景与动机

纳什均衡(NE)处完全信息静态博弈→每方确知他方类型。现实博弈→常存信息不对称:①对手类型未知(不完全信息)→哈桑尼引"自然"首动抽类型→转贝叶斯博弈→解=贝叶斯纳什均衡(BNE);②BNE假静态→未处动态中观察对手行动后可推断其私有信息→需更动态概念。

子博弈完美均衡(SPE)处完全信息动态博弈→要求每个子博弈上策略纳什→消不可信威胁。然SPE难直用于不完全信息→因:不完全信息博弈经哈桑尼转换后→多信息集含多节点→子博弈或仅始于单节点信息集→SPE约束力弱。故需PBE:在所有信息集上→非仅子博弈起点→参与者据信念最优行动。

核心三要素

PBE三元组 (σ,μ)(\sigma,\mu):①策略组合σ\sigma→各参与者在各信息集规定行动(可混合);②信念系统μ\mu→各信息集上参与者对各节点所在概率分布的推测;③两条件耦合→序贯理性+信念一致性

贝叶斯更新与信念系统

信息集hh含多可能节点{x1,x2,,xn}\{x_1,x_2,\dots,x_n\}→参与者iihh需判:若博弈已达hh→实处于哪节点?信念μ(xjh)\mu(x_j|h)表"条件于已达hh→实位xjx_j概率"→xjhμ(xjh)=1\sum_{x_j\in h}\mu(x_j|h)=1

均衡路径上贝叶斯更新:令P(hσ)P(h|\sigma)均衡策略σ\sigma下博弈达hh概率。若P(hσ)>0P(h|\sigma)>0→均衡路径信息集→贝叶斯法则严格适用:μ(xjh)=P(xjσ)P(hσ)\mu(x_j|h)=\frac{P(x_j|\sigma)}{P(h|\sigma)}

非均衡路径信念:若P(hσ)=0P(h|\sigma)=0→信息集在均衡中不会被达→贝叶斯法则无定义→信念可任意→此自由度引多重均衡问题→催生精炼概念(序贯均衡等)。

序贯理性 (Sequential Rationality)

给定信念系统μ\mu→各参与者在所有信息集上(含均衡路径+非均衡路径)→策略σi\sigma_i须是后续博弈的最优反应→即:对参与者ii的各信息集hhσi\sigma_i最大化其条件于信念μ(h)\mu(\cdot|h)的期望支付→无论此信息集在均衡中是否被达。此条件消不可信威胁→因即使偏离均衡→此后参与者仍据一致信念最优反应→故原均衡中无参与愿单方偏离。

公式→对ii的各信息集hh与任意替代策略σi\sigma_i'

Eμ,σ[uih]Eμ,(σi,σi)[uih]\mathbb{E}_{\mu,\sigma}[u_i|h]\geq\mathbb{E}_{\mu,(\sigma_i',\sigma_{-i})}[u_i|h]

一致性条件 (Consistency)

信念μ\mu须与策略σ\sigma"合理"一致。弱版要求:均衡路径上μ\mu由贝叶斯法则从σ\sigma推。强版(序贯均衡)→μ\mu须为一系列完全混合策略(每行动皆正概率)对应信念的极限→消"不合理"非均衡信念。

经典例→啤酒-蛋饼博弈(Beer-Quiche Game; Cho \& Kreps, 1987):强者喜啤→弱者喜蛋饼→但弱者或伪饮啤示强。PBE可容两种均衡:①分离均衡→强饮啤弱食蛋饼→接收者观食蛋饼者确知弱→不斗;②混同均衡→两型皆饮啤→接收者观饮啤不变信念→然直觉标准(Intuitive Criterion)精炼消不合理混同均。

形式定义

完美贝叶斯均衡为信念-策略对(σ,μ)(\sigma^*,\mu^*)满足:

  1. 序贯理性:对各参与者ii与各信息集hhii行动处)→σi\sigma_i^*最大化iihh的期望支付→条件于信念μ(h)\mu^*(h)σi\sigma_{-i}^*
  2. 贝叶斯一致性(均衡路径):若信息集hhσ\sigma^*下以正概率被达→则μ(h)\mu^*(h)由贝叶斯法则从σ\sigma^*推出。
  3. 信念独立性:各信息集信念仅通过各参与者各自观察更新→不同参与者同信息集推断一致(共同先验下)。

与其它均衡概念比较

  • vs 纳什均衡(NE):NE仅求均衡路径最优→不处非均衡路径信念/行动→PBE处处处信息集。
  • vs 子博弈完美均衡(SPE):SPE求每子博弈纳什→仅限单节点开启子博弈→PBE求所有信息集最优→更精细→对不完全信息博弈更适用。完全信息下PBE=SPE。
  • vs 贝叶斯纳什均衡(BNE):BNE处静态不完全信息→无信念更新→PBE广至动态。
  • vs 序贯均衡(Sequential Equilibrium):序贯均衡(Kreps \& Wilson, 1982)加强一致性要求→信念须为完全混合策略极限→消不合理非均衡信念→每序贯均衡皆PBE→反之未必。
  • vs 颤抖手完美均衡(Trembling-hand PE):更精细→要求对策略微小扰动稳健→与序贯均衡紧密关联。

应用: 信号传递博弈

PBE核心应用→信号传递博弈(Signaling Game; Spence, 1973):发送者具私有类型θ\theta→选信号mm→接收者观mm后选行动aa。PBE要求:①接收者对每信号mm持后验信念μ(θm)\mu(\theta|m)→②给定μ\mu→接收者行动最优;③给定接收者反应→发送者信号最优;④均衡路径上μ(m)\mu(\cdot|m)由贝叶斯法则推。经典例:劳动力市场信号→高能力者获教育以分于低能者→教育成本差异支撑分离。

啤酒-蛋饼博弈详析:发送者θ{,}\theta\in\{\text{强},\text{弱}\}→选信号{啤酒,蛋饼}\{啤酒,蛋饼\}→强型饮啤无成本/食蛋饼有成本cSc_S→弱型反之→接收者观信号后决斗否→博弈支付:发送者不欲被斗→接收者愿斗弱不愿斗强。

PBE解类:①分离均衡→强饮啤弱食蛋饼→接收者信念:观饮啤信强(P=1)→不斗;观食蛋饼信弱(P=1)→斗。强型无动改→弱型若伪饮啤→接收者观饮啤仍(均衡路)信强不斗→弱获更高支付!等等——此论需查:弱伪饮啤→信念若仍P(强|啤)=1→不斗→弱获益→何阻?分离均衡须满足激励相容:弱食蛋饼支付≥弱伪饮啤支付。设斗致损D→弱食蛋饼成本cWc_W→弱食蛋饼支=-cWc_W-D(斗);弱伪饮啤→若无斗支=0→>-cWc_W-D→分离瓦解。故分离均须辅以"饮啤即强"信念→此均衡路径信念合理。

混同均衡→两型皆饮啤→接收者观饮啤信念=先验μ0\mu_0→若先验P(强)高→不斗最优。然直觉标准精炼可消:弱型永无动机伪饮啤(与强同行动);若接收者观饮啤→应推"唯强有动机饮啤"→信"啤=强"→混同不可持。

多重均衡与精炼

PBE一大弱点→多重均衡猖獗→因非均衡路径信念可任意设定→可"威胁"出多种均衡。精炼文献(Cho-Kreps直觉标准、Banks-Sobel神性标准D1/D2、Perfect Sequential Equilibrium)→限制非均衡路径信念→仅容"合理"推断→缩均衡集。核心理念:若某类型永无动机发某信号(无论信念)→接收者不应信该信号来自该类型。

局限与批评

  • 信念任意性:非均衡路径信念无客观规则→主观设信念可支任何结果→削弱预测力。
  • 认知要求高:PBE假设参与者晓博弈结构+全策略组合+能行贝叶斯更新→实中局限。
  • 均衡精炼缺乏共识:多种精炼标准竞争→无统一"正确"精炼→应用须详审。
  • 多阶段复杂性:长动态博弈中信念更新链→微小偏离放大→PBE分析繁重。

历史与影响

Kreps \& Wilson(1982)于《Econometrica》发表"Sequential Equilibria"→同时Fudenberg \& Tirole(1991)系统化PBE→成不完全信息动态博弈标准工具。应用辐射:产业组织理论(限价博弈声誉模型)→政治经济学(选举信号)→金融微观结构(内部人交易)→劳动经济学(教育信号)→契约理论(信号甄别)。PBE奠基信息经济学→2001年阿克洛夫/斯彭斯/斯蒂格利茨获诺贝尔→PBE为斯彭斯信号模型理论核心。

虽受多重均衡与精炼问题所困→PBE仍是分析信息不对称+动态策略互动的不可或缺框架→现代博弈论支柱之一。