ARTICLE

标准形式博弈

标准形式博弈（normal-form game），又称策略形式博弈（strategic-form game），是博弈论中最基础的博弈表示方式。它通过三个核心要素完整刻画一个静态博弈情境：参与者集合、每个参与者的纯策略空间、以及定义在所有策略组合上的效用函数（payoff function）。三要素缺一不可，共同构成博弈的完整描述。与扩展形式相比，标准形式舍弃

浏览 0 更新 2025-11-08

标准形式博弈（normal-form game），又称策略形式博弈（strategic-form game），是博弈论中最基础的博弈表示方式。它通过三个核心要素完整刻画一个静态博弈情境：参与者集合、每个参与者的纯策略空间、以及定义在所有策略组合上的效用函数（payoff function）。三要素缺一不可，共同构成博弈的完整描述。与扩展形式相比，标准形式舍弃了时序与信息结构，将博弈简化为策略与支付之间的函数关系，使其成为分析同时行动静态博弈的理想工具。标准形式也是学习更复杂博弈模型（如动态博弈、不完全信息博弈）的必经起点。

三要素的形式定义

设博弈有 $n$ 个参与者，记参与者集合为 $N = \{1, 2, \ldots, n\}$ 。对每个参与者 $i \in N$ ，其纯策略空间为 $S_i$ ，表示该参与者所有可行策略的集合。一个策略组合（strategy profile） $s = (s_1, s_2, \ldots, s_n) \in S_1 \times S_2 \times \cdots \times S_n$ 描述了所有参与者各选一个策略后的完整局面。参与者 $i$ 的效用函数 $u_i: S_1 \times \cdots \times S_n \to \mathbb{R}$ 赋予每个策略组合一个实数值，反映 $i$ 在该结果下的偏好排序。效用函数满足冯·诺依曼-摩根斯坦（von Neumann-Morgenstern）公理时，可进一步处理涉及风险与概率的混合策略情形，这为后续讨论混合策略纳什均衡奠定了公理化基础。

对于两人有限策略博弈，标准形式通常以支付矩阵（payoff matrix）呈现：行对应参与者 1 的策略，列对应参与者 2 的策略，每个单元格内有序数对 $(u_1, u_2)$ ，前者为行参与者的效用，后者为列参与者的效用。囚徒困境是经典范例——两个囚徒各可选择"坦白"或"抵赖"，支付矩阵直观展示了个体理性与集体理性的冲突：各自追求最优却导致对双方都更差的结局。对于三人及以上的博弈，则需使用多维数组或分层表格表示，其复杂度随参与者人数指数增长。

核心解概念

严格占优（strict dominance）：若对参与者 $i$ ，存在策略 $s_i^*$ 使得无论对手选择何种策略，均有 $u_i(s_i^*, s_{-i}) > u_i(s_i', s_{-i})$ 对所有 $s_i' \neq s_i^*$ 和所有 $s_{-i}$ 成立，则 $s_i^*$ 是严格占优策略。严格占优策略若存在，必然是理性参与者的唯一选择。更弱的版本是弱占优（weak dominance），将严格不等式替换为 $\geq$ 且至少一个严格成立。逐次剔除严格劣策略（iterated elimination of strictly dominated strategies, IESDS）可逐步缩小均衡候选范围，其核心逻辑在于"理性参与者不会选择严格劣策略"这一常识（common knowledge）。但剔除顺序在弱占优下可能影响最终结果，需谨慎处理。

纳什均衡（Nash equilibrium）：策略组合 $s^*$ 满足对每个参与者 $i$ ， $u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*)$ 对所有 $s_i \in S_i$ 成立。即每个参与者单方面偏离无法提高自身效用。纳什均衡是标准形式博弈的核心预测概念，但并非所有博弈都有纯策略纳什均衡——匹配便士即为一例。纳什均衡的本质是最优反应对应（best response correspondence）的不动点，这一视角为均衡存在性的证明提供了拓扑学路径。

混合策略（mixed strategy）：参与者在纯策略上的概率分布 $\sigma_i \in \Delta(S_i)$ ，其中 $\Delta(S_i)$ 表示 $S_i$ 上的所有概率分布的单纯形。此时期望效用为 $\mathbb{E}[u_i(\sigma_i, \sigma_{-i})] = \sum_{s \in S} u_i(s) \prod_{j \in N} \sigma_j(s_j)$ 。纳什定理（Nash, 1950）运用角谷不动点定理（Kakutani fixed-point theorem）证明，任何有限标准形式博弈都存在至少一个混合策略纳什均衡。这是博弈论中最深刻的结论之一。匹配便士（matching pennies）即为纯策略无均衡而混合策略存在唯一均衡 $\left(\frac{1}{2}, \frac{1}{2}\right)$ 的经典案例。协调博弈（如性别战，Battle of the Sexes）则同时拥有纯策略和混合策略均衡，体现了多重均衡带来的协调问题。

与扩展形式的关系

标准形式将博弈抽象为策略与支付的一一对应，舍弃了时序与信息结构。扩展形式博弈（extensive-form game）通过博弈树刻画行动顺序和信息集，信息更丰富但维度更高。任一扩展形式博弈均可转化为等价的标准形式——将每个参与者的一个完整相机计划（contingent plan）映射为标准形式中的一个纯策略。然而这种转化存在维度爆炸问题：若扩展形式中每个信息集有 $k$ 个行动， $m$ 个信息集，则标准形式纯策略数可达 $k^m$ 。这一局限促使了子博弈完美均衡（subgame perfect equilibrium）和序列均衡（sequential equilibrium）等专为扩展形式设计的精炼概念的发展。反过来，标准形式的纳什均衡概念是这些精炼概念的共同理论基础。

应用与局限

标准形式博弈简洁直观，适用于单次、同时行动的静态场景——如密封拍卖、古诺竞争、伯特兰竞争、协调博弈和公共品博弈等。在产业组织理论中，古诺双寡头模型即为标准形式博弈的典型应用，企业同时选择产量，利润由市场逆需求函数决定。其核心局限在于无法区分行动时序：所有参与者被视为同时选择策略，即便现实中决策有先后。当行动顺序和信念更新至关重要时（如信号博弈、重复博弈），扩展形式是更合适的分析框架。此外，标准形式也无法直接刻画不完全信息；这类情境需借助贝叶斯博弈（Bayesian game）框架，将类型空间引入标准形式的建模之中。海萨尼转换（Harsanyi transformation）是连接完全信息与不完全信息博弈的桥梁。尽管如此，标准形式因其数学简洁性和纳什均衡理论的完备性，始终是博弈论教学与研究的逻辑起点，也是理解更复杂博弈模型的基础。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。