ARTICLE

策略博弈

策略博弈 (Strategic Game / Normal-Form Game) 策略博弈(strategic game / normal-form game)→博弈论最基础的博弈表达形式→与展开型博弈(extensive form)并列→亦称策略型博弈或标准式博弈。策略博弈抽象掉时序→将博弈压缩为三要素:参与者集、各参与者的策略集、各策略组合对应的支付(p

浏览 0 更新 2025-11-21

策略博弈 (Strategic Game / Normal-Form Game)

策略博弈(strategic game / normal-form game)→博弈论最基础的博弈表达形式→与展开型博弈(extensive form)并列→亦称策略型博弈标准式博弈。策略博弈抽象掉时序→将博弈压缩为三要素:参与者集、各参与者的策略集、各策略组合对应的支付(payoff)。由冯·诺依曼摩根斯坦(1944)在《博弈论与经济行为》中系统化→为纳什均衡的分析框架。

形式定义

策略博弈Γ=N,(Si)iN,(ui)iN\Gamma=\langle N,(S_i)_{i\in N},(u_i)_{i\in N}\rangle,其中:

  • N={1,2,,n}N=\{1,2,\dots,n\}:有限参与者集合。
  • SiS_i:参与者ii纯策略集(可有限亦可连续)。策略是参与者对博弈中每一可能情境的完整行动计划→策略博弈中因无时序→策略即单次选择。
  • ui:jNSjRu_i:\prod_{j\in N}S_j\to\mathbb{R}:参与者ii支付函数→将每个策略剖面(strategy profile)s=(s1,,sn)s=(s_1,\dots,s_n)映射到实值支付→反映ii的偏好。

策略博弈常以支付矩阵(payoff matrix)表→二人有限博弈时矩阵直观:行玩家策略为行→列玩家策略为列→每格记(u,u)(u_{\text{行}},u_{\text{列}})。经典囚徒困境矩阵:两嫌犯各可选"坦白"或"沉默"→支付(行,列)为(–5,–5)双坦白→(0,–10)/(–10,0)单方坦白→(–1,–1)双沉默。策略博弈的精妙→在于"沉默,沉默"虽帕累托优于"坦白,坦白"→却非均衡→个人理性与集体理性冲突尽显。

策略博弈 vs 展开型博弈

策略博弈与展开型博弈的核心差异:

  • 时序抽象:策略博弈不刻画"谁何时行动"→参与者同时选策略;展开型博弈以博弈树显含时序、信息集与行动顺序。
  • 策略概念:展开型博弈中策略=各信息集行动之完整计划→策略博弈中策略=一次性全面选择。任一展开型博弈均可"压缩"为策略博弈→反之多策略博弈可对应不同展开型博弈。
  • 分析层级:策略博弈适用于静态博弈→如囚徒困境古诺竞争;展开型博弈适用动态博弈→如斯塔克伯格竞争蜈蚣博弈
  • 纳什均衡在策略博弈中直接可定义→而子博弈完美均衡等动态精炼须展开型框架。

纯策略与混合策略

纯策略(pure strategy)指参与者确定性地选择某siSis_i\in S_i混合策略(mixed strategy)σi\sigma_iSiS_i上的概率分布→σi(si)\sigma_i(s_i)为选sis_i的概率。令Σi\Sigma_iii的混合策略集(单纯形)。混合策略下→期望支付:

E[ui(σ)]=sS(jNσj(sj))ui(s)\mathbb{E}[u_i(\sigma)]=\sum_{s\in S}\left(\prod_{j\in N}\sigma_j(s_j)\right)u_i(s)

混合策略的引入→解决纯策略纳什均衡不存在问题(如猜硬币博弈)→纳什存在定理:每有限策略博弈至少存在一个(可能混合)纳什均衡。

混合策略的存在性由纳什存在定理(1950)保证:凡有限策略博弈→至少存在一个混合策略纳什均衡。定理证明赖角谷不动点定理(或布劳威尔不动点定理)→将最优反应对应映射于策略单纯形之积→不动点即均衡。混合策略也启群体解释:非一人随机化→而大量同质参与者→各选纯策略→混合比例反映群体分布→此解释通演化博弈论

纳什均衡

策略博弈的中心解概念→纳什均衡(Nash Equilibrium, NE):策略剖面σ=(σ1,,σn)\sigma^*=(\sigma_1^*,\dots,\sigma_n^*)→使得对每位参与者ii与任意σiΣi\sigma_i\in\Sigma_i

ui(σi,σi)ui(σi,σi)u_i(\sigma_i^*,\sigma_{-i}^*)\geq u_i(\sigma_i,\sigma_{-i}^*)

即:给定他人策略不变→无人可单方偏离获益。NE是策略博弈的"自执行协议"→但非合作博弈不保证帕累托效率(囚徒困境即经典反例)。

占优与可理性化

策略博弈有比NE更基本的解概念:

  • 严格占优策略sis_i^*严格占优sis_i'若对任意sis_{-i}ui(si,si)>ui(si,si)u_i(s_i^*,s_{-i})>u_i(s_i',s_{-i})。若某策略对所有对手策略皆最优→为严格占优策略→必是NE的组成部分。
  • 重复占优消去(Iterated Elimination of Strictly Dominated Strategies):逐轮删严格被占优策略→剩余策略构成"可理性化策略"的超集→若唯一剩→该策略剖面为唯一NE。
  • 可理性化(Rationalizability):参与者仅选最优反应链中可证立的策略→要求比NE弱→策略集通常大于NE集。

二人零和博弈

策略博弈的重要特殊类→二人零和博弈:s,  u1(s)+u2(s)=0\forall s,\;u_1(s)+u_2(s)=0→双方利益严格对立。冯·诺依曼极小极大定理(1928)奠基:有限二人零和博弈混合策略下→存在值vv使行玩家能保证期望支付v\geq v→列玩家能限制行玩家于v\leq v→双方最优混合策略成NE→vv即博弈的值。应用:足球罚球网络安全军事战术

贝叶斯博弈与策略形式

不完全信息下→哈桑尼(1967-68)引入"自然"先行抽类型→得贝叶斯博弈。贝叶斯博弈可记为策略博弈形式:各参与者策略=类型依存的行动计划→支付=期望支付(对他人类型取期望)→解=贝叶斯纳什均衡(BNE)。策略博弈抽象框架由此"承"不完全信息扩展。

应用与局限

\paragraph{应用}策略博弈→经济学核心建模工具:寡头竞争(古诺量竞争/伯特兰价竞争)→拍卖理论(密封投标)→投票博弈国际关系(威慑博弈)→演化生物学(鹰鸽博弈)。简洁性使策略博弈成为博弈论"入门语言"。

\paragraph{局限}①抽象时序→难捕获承诺/威胁/报复等动态机制→②多参与者时支付矩阵维度爆炸→③假设同时行动→现实中许多策略互动具先后→④均值支付框架→难纳贴现与重复交互。此等局限推动展开型博弈、重复博弈随机博弈等更丰富框架发展。

策略博弈与关联均衡:策略博弈另有一重要扩展→关联均衡(Correlated Equilibrium, 奥曼1974):参与者据公共随机信号协调策略→比NE更广(每NE皆关联均衡)→支付可超NE→为通信博弈机制设计奠基。关联均衡突破策略博弈"独立混合"隐性假设→允策略相关→更贴近现实协调行为。

历史

策略博弈→渊源可溯库尔诺(1838)双寡头分析→现代形式化始于冯·诺依曼(1928)极小极大定理及冯·诺依曼与摩根斯坦(1944)巨著。约翰·纳什(1950-51)以不动点定理证纳什均衡存在→将策略博弈推至非零和领域→奠现代博弈论。1950年代后→奥曼谢林哈桑尼泽尔滕等深化→博弈论渐入经济学核心→1994年纳什/哈桑尼/泽尔滕获诺贝尔经济学奖。

策略博弈虽简约→却是博弈论逻辑源头→理解策略博弈即掌握博弈论"语法"→一切后续精炼与扩展皆从此根基展开。