ARTICLE

矩阵形式

矩阵形式 (Normal Form / Strategic Form) 矩阵形式（Matrix Form），又称标准形式（Normal Form）或策略形式（Strategic Form），是博弈论中用于描述和分析博弈的两种基本表示方法之一。与以树状结构展开的扩展形式（Extensive Form）相对应，矩阵形式将博弈抽象为一个二维支付矩阵，清晰展现各参与

浏览 0 更新 2026-07-14

矩阵形式 (Normal Form / Strategic Form)

矩阵形式（Matrix Form），又称标准形式（Normal Form）或策略形式（Strategic Form），是博弈论中用于描述和分析博弈的两种基本表示方法之一。与以树状结构展开的扩展形式（Extensive Form）相对应，矩阵形式将博弈抽象为一个二维支付矩阵，清晰展现各参与人的策略集及相应收益。矩阵形式的核心优势在于简洁性与静态分析的便利性——它将博弈中的时间顺序和信息的动态更新压缩至一个静态快照，使分析者能够专注于策略交互的纳什均衡求解。

标准形式的数学定义

一个标准的矩阵形式博弈由三个基本要素组成：

参与人集合 $N = \{1, 2, \dots, n\}$ ：博弈中理性决策主体的集合，每个参与人 $i$ 有自己的支付函数（支付函数）。
策略空间 $S_i$ ：每个参与人 $i$ 的纯策略集合，记 $s_i \in S_i$ 。
支付函数 $u_i: S \to \mathbb{R}$ ：对于每一策略组合，参与人 $i$ 获得的收益。

双人有限策略博弈可记为 $G = (S_1, S_2; u_1, u_2)$ ，其支付结构通常用 $m \times n$ 矩阵表示——行对应参与人1的策略，列对应参与人2的策略，单元格依次列出二人的支付。

矩阵形式的博弈论基础

冯·诺依曼与摩根斯坦在1944年的《博弈论与经济行为》中首次系统化建立了这一表示框架。博弈被设定为一次性的、同时行动的（Simultaneous Move）交互——参与人在不了解对方选择的前提下独立决策，这与扩展形式所代表的序贯博弈形成对照。矩阵形式的基本假设包括：参与人完全理性（理性经济人），策略集合为共同知识（Common Knowledge），在完全信息博弈中支付函数亦为共同知识。

经典案例：囚徒困境

囚徒困境是矩阵形式最著名的示例。两名囚徒被隔离审讯，每人可选择合作（C）或背叛（D），支付矩阵如下：

\begin{bmatrix} & \text{囚徒2: C} & \text{囚徒2: D} \\ \text{囚徒1: C} & (-1, -1) & (-3, 0) \\ \text{囚徒1: D} & (0, -3) & (-2, -2) \end{bmatrix}

策略 D 严格优于 C，唯一占优策略均衡为 (D, D)，支付 $(-2, -2)$ 。若双方均选择 C 可得 $(-1, -1)$ ——一个帕累托改进——揭示了个体理性与集体理性的经典矛盾。

混合策略与纳什均衡求解

矩阵形式还为混合策略纳什均衡的求解提供了直观代数框架。纳什（1950）证明了任何有限矩阵形式博弈至少存在一个混合策略纳什均衡。核心条件为无差异原则：均衡时一方的混合策略须使对手选择任何正概率纯策略时获得相同期望支付。

以性别之战（Battle of the Sexes）为例，该博弈存在两个纯策略纳什均衡及一个混合策略均衡。设女友以概率 $p$ 选拳击，男友以概率 $q$ 选拳击，根据无差异原则可解得 $p = \frac{2}{3}$ 、 $q = \frac{1}{3}$ 。

局限性与扩展应用

矩阵形式无法处理序贯博弈中的行动顺序，也无法刻画信息集。在不完全信息博弈中，海萨尼的类型空间方法虽仍可用矩阵形式，但策略空间随类型数指数增长。在多重均衡时需借助帕累托占优或风险占优等精炼标准进行选择。尽管如此，矩阵形式仍是产业组织、拍卖理论和机制设计等领域的基础分析工具——从古诺竞争到伯特兰竞争，从公共品供给中的搭便车问题到多智能体系统中的对抗性博弈，矩阵形式提供了统一的策略分析语言。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。