ARTICLE

规范形

规范形 (Normal Form) 规范形（Normal Form，也称策略形，Strategic Form）是博弈论中描述博弈的最基本方式。它将一个博弈抽象为三个核心要素的集合：玩家集合、每个玩家的策略空间以及定义在所有策略组合上的支付函数。规范形博弈凝练地刻画了策略互动的结构性信息——谁参与、各自能做什么、结果如何——而不描述行动的先后顺序或信息结构。这

浏览 0 更新 2025-12-09

规范形 (Normal Form)

规范形（Normal Form，也称策略形，Strategic Form）是博弈论中描述博弈的最基本方式。它将一个博弈抽象为三个核心要素的集合：玩家集合、每个玩家的策略空间以及定义在所有策略组合上的支付函数。规范形博弈凝练地刻画了策略互动的结构性信息——谁参与、各自能做什么、结果如何——而不描述行动的先后顺序或信息结构。这种表示方法是定义纳什均衡、研究占优策略和分析静态博弈的标准框架。

定义

一个有限 $n$ 人规范形博弈由三元组 $G = \langle N, \{S_i\}_{i \in N}, \{u_i\}_{i \in N} \rangle$ 定义：

$N = \{1, 2, \ldots, n\}$ 为玩家集合。
对每个玩家 $i \in N$ ， $S_i$ 是其纯策略空间（亦称策略集）。
对每个玩家 $i \in N$ ， $u_i: S_1 \times S_2 \times \cdots \times S_n \to \mathbb{R}$ 是其支付函数（Payoff Function），它将每一个策略组合映射为玩家 $i$ 的效用或收益。

令 $S = \prod_{i=1}^n S_i$ 为所有策略组合（Strategy Profile）的集合。常记 $\mathbf{s} = (s_1, \ldots, s_n) \in S$ ，并采用记号 $\mathbf{s}_{-i} = (s_1, \ldots, s_{i-1}, s_{i+1}, \ldots, s_n)$ 表示除玩家 $i$ 外其他玩家的策略。此时 $u_i(s_i, \mathbf{s}_{-i})$ 表示当玩家 $i$ 选择 $s_i$ 而其他玩家选择 $\mathbf{s}_{-i}$ 时玩家 $i$ 的支付。

二人有限博弈的矩阵表示

当只有两名玩家且策略集为有限集时，规范形博弈通常以支付矩阵（Payoff Matrix 或 Bimatrix）的形式呈现。以经典的囚徒困境为例：

\begin{array}{c|cc} & \text{坦白} & \text{抵赖} \\ \hline \text{坦白} & (-5, -5) & (0, -10) \\ \text{抵赖} & (-10, 0) & (-1, -1) \end{array}

行代表玩家 1 的策略，列代表玩家 2 的策略，矩阵的每个单元格 $(a, b)$ 表示行玩家和列玩家分别获得的支付。这种表示直观且便于分析有限博弈的均衡。

对于三人或更多玩家，支付用多维数组（张量）表示，维度随玩家数量指数增长，这是规范形表示的一个实际局限。

混合策略

在许多博弈中，纯策略空间上的纳什均衡可能不存在。为此，需要将策略概念从纯策略扩展为混合策略。

玩家 $i$ 的一个混合策略 $\sigma_i$ 是其纯策略集 $S_i$ 上的一个概率分布：

\sigma_i \in \Delta(S_i) = \left\{ \sigma_i \in \mathbb{R}^{|S_i|} : \sum_{s_i \in S_i} \sigma_i(s_i) = 1, \; \sigma_i(s_i) \geq 0 \right\}

即 $\sigma_i(s_i)$ 表示玩家 $i$ 以概率 $\sigma_i(s_i)$ 选择纯策略 $s_i$ 。所有玩家的混合策略构成混合策略组合 $\boldsymbol{\sigma} = (\sigma_1, \ldots, \sigma_n)$ 。玩家 $i$ 在混合策略组合 $\boldsymbol{\sigma}$ 下的期望支付为：

U_i(\boldsymbol{\sigma}) = \sum_{\mathbf{s} \in S} \left[ \prod_{j=1}^n \sigma_j(s_j) \right] u_i(\mathbf{s})

纳什均衡

规范形博弈中最重要的解概念是纳什均衡。定义玩家 $i$ 的最优反应对应（Best Response Correspondence）为：

BR_i(\mathbf{s}_{-i}) = \{ s_i \in S_i : u_i(s_i, \mathbf{s}_{-i}) \geq u_i(s_i', \mathbf{s}_{-i}), \; \forall s_i' \in S_i \}

给定规范形博弈 $\langle N, \{S_i\}, \{u_i\} \rangle$ ，策略组合 $\mathbf{s}^* = (s_1^*, \ldots, s_n^*)$ 是一个纯策略纳什均衡当且仅当：

u_i(s_i^*, \mathbf{s}_{-i}^*) \geq u_i(s_i, \mathbf{s}_{-i}^*), \quad \forall s_i \in S_i, \; \forall i \in N

等价地， $s_i^* \in BR_i(\mathbf{s}_{-i}^*)$ 对所有 $i$ 成立——纳什均衡本质上是各玩家最优反应的"不动点"。即每个玩家在给定其他玩家策略不变的情况下，单方面偏离不能获得更高支付。纳什均衡是博弈论中理性行为的核心基准，广泛应用于寡头市场分析、拍卖理论和机制设计等领域。

严格占优与被占优策略

规范形表示便于分析策略间的占优关系：

纯策略 $s_i$ 严格占优纯策略 $s_i'$ ，若对任意 $\mathbf{s}_{-i}$ ，恒有 $u_i(s_i, \mathbf{s}_{-i}) > u_i(s_i', \mathbf{s}_{-i})$ 。被严格占优的策略永远不会被理性玩家选择，可以通过重复剔除严格被占优策略（Iterated Elimination of Strictly Dominated Strategies）逐步简化博弈。
若每个玩家都有严格占优策略，则该策略组合构成博弈的唯一纳什均衡，典型例子是囚徒困境中的（坦白, 坦白）。
当重复剔除非严格被占优策略时，剔除顺序可能影响最终结果，这是该方法的局限性。

规范形与展开形的比较

规范形是展开形博弈（Extensive Form Games）的互补表示。两者各有侧重：

规范形：高度抽象，压缩了行动顺序和信息结构，仅保留策略与支付的映射关系。适合分析同时行动博弈和定义纳什均衡，但对信息不完全或顺序行动的刻画力不足。
展开形：使用博弈树显式表征行动的先后顺序、各节点的信息集和可选行动。适合分析子博弈精炼均衡、序贯理性和信号博弈等涉及信息结构的博弈情境。

每一个展开形博弈都可以通过"策略化"转换为一个规范形博弈——令每个玩家的策略为其在每个信息集上的行动计划的完整规定。但转换后的规范形可能丢失原始展开形的许多结构信息（如策略的序贯关系），且策略数量随信息集个数呈指数增长。因此，两种表示各就其位：规范形适合"一锤子"同时决策场景，展开形适合多阶段、有信息不对称的动态博弈。

应用与局限

规范形博弈是博弈论教学的起点，其矩阵表现形式直观清晰，便于手工计算二人博弈的纳什均衡。对于有限二人博弈，寻找混合策略纳什均衡的标准方法是：固定对手的混合策略，令己方各纯策略的期望支付相等，由此解出对手的均衡混合概率。在理论层面，纳什存在性定理正是建立在规范形框架上：任何具有有限玩家集和紧凸策略空间、拟凹连续支付函数的规范形博弈，均存在混合策略纳什均衡，其证明依赖于角谷不动点定理在最优反应对应上的应用。

然而，规范形的主要局限性在于"维数灾难"：当玩家数量或策略数量增加时，支付矩阵的规模呈指数膨胀，使存储和分析变得不可行。此外，规范形将所有策略视为原子化的选项集合，忽略了一个策略往往是"如果……则……"的条件计划这一事实，而这恰恰是展开形的优势所在。因此，在实际建模中，研究者应根据博弈的信息结构和行动时序，恰当选择规范形或展开形作为分析框架。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。