ARTICLE

策略博弈

策略博弈 (Strategic Game / Normal-Form Game) 策略博弈(strategic game / normal-form game)→博弈论最基础的博弈表达形式→与展开型博弈(extensive form)并列→亦称策略型博弈或标准式博弈。策略博弈抽象掉时序→将博弈压缩为三要素：参与者集、各参与者的策略集、各策略组合对应的支付(p

浏览 0 更新 2025-11-21

策略博弈 (Strategic Game / Normal-Form Game)

策略博弈(strategic game / normal-form game)→博弈论最基础的博弈表达形式→与展开型博弈(extensive form)并列→亦称策略型博弈或标准式博弈。策略博弈抽象掉时序→将博弈压缩为三要素：参与者集、各参与者的策略集、各策略组合对应的支付(payoff)。由冯·诺依曼与摩根斯坦(1944)在《博弈论与经济行为》中系统化→为纳什均衡的分析框架。

形式定义

策略博弈 $\Gamma=\langle N,(S_i)_{i\in N},(u_i)_{i\in N}\rangle$ ，其中：

$N=\{1,2,\dots,n\}$ ：有限参与者集合。
$S_i$ ：参与者 $i$ 的纯策略集（可有限亦可连续）。策略是参与者对博弈中每一可能情境的完整行动计划→策略博弈中因无时序→策略即单次选择。
$u_i:\prod_{j\in N}S_j\to\mathbb{R}$ ：参与者 $i$ 的支付函数→将每个策略剖面(strategy profile) $s=(s_1,\dots,s_n)$ 映射到实值支付→反映 $i$ 的偏好。

策略博弈常以支付矩阵(payoff matrix)表→二人有限博弈时矩阵直观：行玩家策略为行→列玩家策略为列→每格记 $(u_{\text{行}},u_{\text{列}})$ 。经典囚徒困境矩阵：两嫌犯各可选"坦白"或"沉默"→支付(行,列)为(–5,–5)双坦白→(0,–10)/(–10,0)单方坦白→(–1,–1)双沉默。策略博弈的精妙→在于"沉默,沉默"虽帕累托优于"坦白,坦白"→却非均衡→个人理性与集体理性冲突尽显。

策略博弈 vs 展开型博弈

策略博弈与展开型博弈的核心差异：

时序抽象：策略博弈不刻画"谁何时行动"→参与者同时选策略；展开型博弈以博弈树显含时序、信息集与行动顺序。
策略概念：展开型博弈中策略=各信息集行动之完整计划→策略博弈中策略=一次性全面选择。任一展开型博弈均可"压缩"为策略博弈→反之多策略博弈可对应不同展开型博弈。
分析层级：策略博弈适用于静态博弈→如囚徒困境、古诺竞争；展开型博弈适用动态博弈→如斯塔克伯格竞争、蜈蚣博弈。
纳什均衡在策略博弈中直接可定义→而子博弈完美均衡等动态精炼须展开型框架。

纯策略与混合策略

纯策略(pure strategy)指参与者确定性地选择某 $s_i\in S_i$ 。混合策略(mixed strategy) $\sigma_i$ 是 $S_i$ 上的概率分布→ $\sigma_i(s_i)$ 为选 $s_i$ 的概率。令 $\Sigma_i$ 为 $i$ 的混合策略集（单纯形）。混合策略下→期望支付：

\mathbb{E}[u_i(\sigma)]=\sum_{s\in S}\left(\prod_{j\in N}\sigma_j(s_j)\right)u_i(s)

混合策略的引入→解决纯策略纳什均衡不存在问题（如猜硬币博弈）→纳什存在定理：每有限策略博弈至少存在一个（可能混合）纳什均衡。

混合策略的存在性由纳什存在定理(1950)保证：凡有限策略博弈→至少存在一个混合策略纳什均衡。定理证明赖角谷不动点定理(或布劳威尔不动点定理)→将最优反应对应映射于策略单纯形之积→不动点即均衡。混合策略也启群体解释：非一人随机化→而大量同质参与者→各选纯策略→混合比例反映群体分布→此解释通演化博弈论。

纳什均衡

策略博弈的中心解概念→纳什均衡(Nash Equilibrium, NE)：策略剖面 $\sigma^*=(\sigma_1^*,\dots,\sigma_n^*)$ →使得对每位参与者 $i$ 与任意 $\sigma_i\in\Sigma_i$ ：

u_i(\sigma_i^*,\sigma_{-i}^*)\geq u_i(\sigma_i,\sigma_{-i}^*)

即：给定他人策略不变→无人可单方偏离获益。NE是策略博弈的"自执行协议"→但非合作博弈不保证帕累托效率（囚徒困境即经典反例）。

占优与可理性化

策略博弈有比NE更基本的解概念：

严格占优策略： $s_i^*$ 严格占优 $s_i'$ 若对任意 $s_{-i}$ 有 $u_i(s_i^*,s_{-i})>u_i(s_i',s_{-i})$ 。若某策略对所有对手策略皆最优→为严格占优策略→必是NE的组成部分。
重复占优消去(Iterated Elimination of Strictly Dominated Strategies)：逐轮删严格被占优策略→剩余策略构成"可理性化策略"的超集→若唯一剩→该策略剖面为唯一NE。
可理性化(Rationalizability)：参与者仅选最优反应链中可证立的策略→要求比NE弱→策略集通常大于NE集。

二人零和博弈

策略博弈的重要特殊类→二人零和博弈： $\forall s,\;u_1(s)+u_2(s)=0$ →双方利益严格对立。冯·诺依曼极小极大定理(1928)奠基：有限二人零和博弈混合策略下→存在值 $v$ 使行玩家能保证期望支付 $\geq v$ →列玩家能限制行玩家于 $\leq v$ →双方最优混合策略成NE→ $v$ 即博弈的值。应用：足球罚球、网络安全、军事战术。

贝叶斯博弈与策略形式

不完全信息下→哈桑尼(1967-68)引入"自然"先行抽类型→得贝叶斯博弈。贝叶斯博弈可记为策略博弈形式：各参与者策略=类型依存的行动计划→支付=期望支付（对他人类型取期望）→解=贝叶斯纳什均衡(BNE)。策略博弈抽象框架由此"承"不完全信息扩展。

应用与局限

\paragraph{应用}策略博弈→经济学核心建模工具：寡头竞争(古诺量竞争/伯特兰价竞争)→拍卖理论(密封投标)→投票博弈→国际关系(威慑博弈)→演化生物学(鹰鸽博弈)。简洁性使策略博弈成为博弈论"入门语言"。

\paragraph{局限}①抽象时序→难捕获承诺/威胁/报复等动态机制→②多参与者时支付矩阵维度爆炸→③假设同时行动→现实中许多策略互动具先后→④均值支付框架→难纳贴现与重复交互。此等局限推动展开型博弈、重复博弈、随机博弈等更丰富框架发展。

策略博弈与关联均衡：策略博弈另有一重要扩展→关联均衡(Correlated Equilibrium, 奥曼1974)：参与者据公共随机信号协调策略→比NE更广（每NE皆关联均衡）→支付可超NE→为通信博弈与机制设计奠基。关联均衡突破策略博弈"独立混合"隐性假设→允策略相关→更贴近现实协调行为。

历史

策略博弈→渊源可溯库尔诺(1838)双寡头分析→现代形式化始于冯·诺依曼(1928)极小极大定理及冯·诺依曼与摩根斯坦(1944)巨著。约翰·纳什(1950-51)以不动点定理证纳什均衡存在→将策略博弈推至非零和领域→奠现代博弈论。1950年代后→奥曼、谢林、哈桑尼、泽尔滕等深化→博弈论渐入经济学核心→1994年纳什/哈桑尼/泽尔滕获诺贝尔经济学奖。

策略博弈虽简约→却是博弈论逻辑源头→理解策略博弈即掌握博弈论"语法"→一切后续精炼与扩展皆从此根基展开。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。