ARTICLE

贝叶斯博弈

贝叶斯博弈 (Bayesian Game) 贝叶斯博弈是博弈论分析不完全信息情景的核心模型——参与者不知对手所有特征(偏好/成本/能力/估值)。由海萨尼引入海萨尼转换→将不完全信息转为可分析的不完美信息博弈。 核心要素 参与者 N=\1, ,n\。行动空间 A_i。类型空间 T_i(核心):类型t_i为私有信息汇总(拍卖中估值/古诺边际成本/劳动力市场能力/

浏览 25 更新 2025-10-25

贝叶斯博弈 (Bayesian Game)

贝叶斯博弈博弈论分析不完全信息情景的核心模型——参与者不知对手所有特征(偏好/成本/能力/估值)。由海萨尼引入海萨尼转换→将不完全信息转为可分析的不完美信息博弈。

核心要素

参与者 N={1,,n}N=\{1,\dots,n\}行动空间 AiA_i类型空间 TiT_i(核心):类型tit_i私有信息汇总(拍卖中估值/古诺边际成本/劳动力市场能力/国军力)。自己知己类但不知他人。信念共同先验分布pp→参与者i观己类型后贝叶斯法则更新→p(titi)p(t_{-i}\mid t_i)(对他人类型的条件概率信念)。收益函数 ui(a1,,an;t1,,tn)u_i(a_1,\dots,a_n; t_1,\dots,t_n)(同时取决于行动和类型)。

贝叶斯纳什均衡(BNE)

策略非简单选行动→而是类型依存的权变计划 si(ti):TiAis_i(t_i):T_i\to A_iss^*为BNE当且仅当每位i每种类型tit_isi(ti)s_i^*(t_i)最大化期望收益

si(ti)argmaxaiAitip(titi)ui(ai,si(ti);ti,ti)s_i^*(t_i) \in \arg\max_{a_i\in A_i} \sum_{t_{-i}} p(t_{-i}\mid t_i) u_i(a_i, s_{-i}^*(t_{-i}); t_i, t_{-i})

无人(无论何种类型)有单方面偏离策略动机。

信息不对称古诺示例

两公司古诺竞争。P=αQ\alpha-Q。公司1成本c(共知)。公司2成本私有:低成本cLc_L概率θ\theta、高成本cHc_H概率1θ1-\theta。策略:公司1→选q1q_1;公司2→类型依产量对(q2L,q2H)(q_{2L},q_{2H})

优化:②低成本→max(αq1q2LcL)q2L\max(\alpha-q_1-q_{2L}-c_L)q_{2L}q2L=(αq1cL)/2q_{2L}=(\alpha-q_1-c_L)/2;高成本→q2H=(αq1cH)/2q_{2H}=(\alpha-q_1-c_H)/2。①期望利润→maxθ[(αq1q2Lc)q1]+(1θ)[(αq1q2Hc)q1]\max\theta[(\alpha-q_1-q_{2L}-c)q_1]+(1-\theta)[(\alpha-q_1-q_{2H}-c)q_1]→反应函数含加权平均期望。联立求解得三元组(q1,(q2L,q2H))(q_1^*,(q_{2L}^*,q_{2H}^*))=BNE。

应用领域

拍卖理论(估值类型→均衡出价策略);信号博弈(有信息方通过行动传私有类型信号);机制设计(反向工程→设计规则引导私有信息参与者达成设计者目标→最优拍卖/税收/公共资源分配);声誉模型(重复博弈中行为推断长期类型→建/毁声誉);信息不对称市场(二手车市场柠檬问题劣币驱逐良币→卖方私有信息影响市场效率)。