ARTICLE
策略博弈
策略博弈 (Strategic Game / Normal-Form Game) 策略博弈(strategic game / normal-form game)→博弈论最基础的博弈表达形式→与展开型博弈(extensive form)并列→亦称策略型博弈或标准式博弈。策略博弈抽象掉时序→将博弈压缩为三要素:参与者集、各参与者的策略集、各策略组合对应的支付(p
策略博弈 (Strategic Game / Normal-Form Game)
策略博弈(strategic game / normal-form game)→博弈论最基础的博弈表达形式→与展开型博弈(extensive form)并列→亦称策略型博弈或标准式博弈。策略博弈抽象掉时序→将博弈压缩为三要素:参与者集、各参与者的策略集、各策略组合对应的支付(payoff)。由冯·诺依曼与摩根斯坦(1944)在《博弈论与经济行为》中系统化→为纳什均衡的分析框架。
形式定义
策略博弈,其中:
- :有限参与者集合。
- :参与者的纯策略集(可有限亦可连续)。策略是参与者对博弈中每一可能情境的完整行动计划→策略博弈中因无时序→策略即单次选择。
- :参与者的支付函数→将每个策略剖面(strategy profile)映射到实值支付→反映的偏好。
策略博弈常以支付矩阵(payoff matrix)表→二人有限博弈时矩阵直观:行玩家策略为行→列玩家策略为列→每格记。经典囚徒困境矩阵:两嫌犯各可选"坦白"或"沉默"→支付(行,列)为(–5,–5)双坦白→(0,–10)/(–10,0)单方坦白→(–1,–1)双沉默。策略博弈的精妙→在于"沉默,沉默"虽帕累托优于"坦白,坦白"→却非均衡→个人理性与集体理性冲突尽显。
策略博弈 vs 展开型博弈
策略博弈与展开型博弈的核心差异:
- 时序抽象:策略博弈不刻画"谁何时行动"→参与者同时选策略;展开型博弈以博弈树显含时序、信息集与行动顺序。
- 策略概念:展开型博弈中策略=各信息集行动之完整计划→策略博弈中策略=一次性全面选择。任一展开型博弈均可"压缩"为策略博弈→反之多策略博弈可对应不同展开型博弈。
- 分析层级:策略博弈适用于静态博弈→如囚徒困境、古诺竞争;展开型博弈适用动态博弈→如斯塔克伯格竞争、蜈蚣博弈。
- 纳什均衡在策略博弈中直接可定义→而子博弈完美均衡等动态精炼须展开型框架。
纯策略与混合策略
纯策略(pure strategy)指参与者确定性地选择某。混合策略(mixed strategy)是上的概率分布→为选的概率。令为的混合策略集(单纯形)。混合策略下→期望支付:
混合策略的引入→解决纯策略纳什均衡不存在问题(如猜硬币博弈)→纳什存在定理:每有限策略博弈至少存在一个(可能混合)纳什均衡。
混合策略的存在性由纳什存在定理(1950)保证:凡有限策略博弈→至少存在一个混合策略纳什均衡。定理证明赖角谷不动点定理(或布劳威尔不动点定理)→将最优反应对应映射于策略单纯形之积→不动点即均衡。混合策略也启群体解释:非一人随机化→而大量同质参与者→各选纯策略→混合比例反映群体分布→此解释通演化博弈论。
纳什均衡
策略博弈的中心解概念→纳什均衡(Nash Equilibrium, NE):策略剖面→使得对每位参与者与任意:
即:给定他人策略不变→无人可单方偏离获益。NE是策略博弈的"自执行协议"→但非合作博弈不保证帕累托效率(囚徒困境即经典反例)。
占优与可理性化
策略博弈有比NE更基本的解概念:
- 严格占优策略:严格占优若对任意有。若某策略对所有对手策略皆最优→为严格占优策略→必是NE的组成部分。
- 重复占优消去(Iterated Elimination of Strictly Dominated Strategies):逐轮删严格被占优策略→剩余策略构成"可理性化策略"的超集→若唯一剩→该策略剖面为唯一NE。
- 可理性化(Rationalizability):参与者仅选最优反应链中可证立的策略→要求比NE弱→策略集通常大于NE集。
二人零和博弈
策略博弈的重要特殊类→二人零和博弈:→双方利益严格对立。冯·诺依曼极小极大定理(1928)奠基:有限二人零和博弈混合策略下→存在值使行玩家能保证期望支付→列玩家能限制行玩家于→双方最优混合策略成NE→即博弈的值。应用:足球罚球、网络安全、军事战术。
贝叶斯博弈与策略形式
不完全信息下→哈桑尼(1967-68)引入"自然"先行抽类型→得贝叶斯博弈。贝叶斯博弈可记为策略博弈形式:各参与者策略=类型依存的行动计划→支付=期望支付(对他人类型取期望)→解=贝叶斯纳什均衡(BNE)。策略博弈抽象框架由此"承"不完全信息扩展。
应用与局限
\paragraph{应用}策略博弈→经济学核心建模工具:寡头竞争(古诺量竞争/伯特兰价竞争)→拍卖理论(密封投标)→投票博弈→国际关系(威慑博弈)→演化生物学(鹰鸽博弈)。简洁性使策略博弈成为博弈论"入门语言"。
\paragraph{局限}①抽象时序→难捕获承诺/威胁/报复等动态机制→②多参与者时支付矩阵维度爆炸→③假设同时行动→现实中许多策略互动具先后→④均值支付框架→难纳贴现与重复交互。此等局限推动展开型博弈、重复博弈、随机博弈等更丰富框架发展。
策略博弈与关联均衡:策略博弈另有一重要扩展→关联均衡(Correlated Equilibrium, 奥曼1974):参与者据公共随机信号协调策略→比NE更广(每NE皆关联均衡)→支付可超NE→为通信博弈与机制设计奠基。关联均衡突破策略博弈"独立混合"隐性假设→允策略相关→更贴近现实协调行为。
历史
策略博弈→渊源可溯库尔诺(1838)双寡头分析→现代形式化始于冯·诺依曼(1928)极小极大定理及冯·诺依曼与摩根斯坦(1944)巨著。约翰·纳什(1950-51)以不动点定理证纳什均衡存在→将策略博弈推至非零和领域→奠现代博弈论。1950年代后→奥曼、谢林、哈桑尼、泽尔滕等深化→博弈论渐入经济学核心→1994年纳什/哈桑尼/泽尔滕获诺贝尔经济学奖。
策略博弈虽简约→却是博弈论逻辑源头→理解策略博弈即掌握博弈论"语法"→一切后续精炼与扩展皆从此根基展开。