ARTICLE

矩阵形式

矩阵形式 (Normal Form / Strategic Form) 矩阵形式(Matrix Form),又称标准形式(Normal Form)或策略形式(Strategic Form),是博弈论中用于描述和分析博弈的两种基本表示方法之一。与以树状结构展开的扩展形式(Extensive Form)相对应,矩阵形式将博弈抽象为一个二维支付矩阵,清晰展现各参与

浏览 0 更新 2026-07-14

矩阵形式 (Normal Form / Strategic Form)

矩阵形式(Matrix Form),又称标准形式(Normal Form)或策略形式(Strategic Form),是博弈论中用于描述和分析博弈的两种基本表示方法之一。与以树状结构展开的扩展形式(Extensive Form)相对应,矩阵形式将博弈抽象为一个二维支付矩阵,清晰展现各参与人的策略集及相应收益。矩阵形式的核心优势在于简洁性与静态分析的便利性——它将博弈中的时间顺序和信息的动态更新压缩至一个静态快照,使分析者能够专注于策略交互的纳什均衡求解。

标准形式的数学定义

一个标准的矩阵形式博弈由三个基本要素组成:

  • 参与人集合 N={1,2,,n} N = \{1, 2, \dots, n\} :博弈中理性决策主体的集合,每个参与人 i i 有自己的支付函数(支付函数)。
  • 策略空间 Si S_i :每个参与人 i i 的纯策略集合,记 siSi s_i \in S_i
  • 支付函数 ui:SR u_i: S \to \mathbb{R} :对于每一策略组合,参与人 i i 获得的收益。

双人有限策略博弈可记为 G=(S1,S2;u1,u2) G = (S_1, S_2; u_1, u_2) ,其支付结构通常用 m×n m \times n 矩阵表示——行对应参与人1的策略,列对应参与人2的策略,单元格依次列出二人的支付。

矩阵形式的博弈论基础

冯·诺依曼摩根斯坦在1944年的《博弈论与经济行为》中首次系统化建立了这一表示框架。博弈被设定为一次性的、同时行动的(Simultaneous Move)交互——参与人在不了解对方选择的前提下独立决策,这与扩展形式所代表的序贯博弈形成对照。矩阵形式的基本假设包括:参与人完全理性(理性经济人),策略集合为共同知识(Common Knowledge),在完全信息博弈中支付函数亦为共同知识。

经典案例:囚徒困境

囚徒困境是矩阵形式最著名的示例。两名囚徒被隔离审讯,每人可选择合作(C)或背叛(D),支付矩阵如下:

[囚徒2: C囚徒2: D囚徒1: C(1,1)(3,0)囚徒1: D(0,3)(2,2)]\begin{bmatrix} & \text{囚徒2: C} & \text{囚徒2: D} \\ \text{囚徒1: C} & (-1, -1) & (-3, 0) \\ \text{囚徒1: D} & (0, -3) & (-2, -2) \end{bmatrix}

策略 D 严格优于 C,唯一占优策略均衡为 (D, D),支付 (2,2)(-2, -2)。若双方均选择 C 可得 (1,1)(-1, -1)——一个帕累托改进——揭示了个体理性与集体理性的经典矛盾。

混合策略与纳什均衡求解

矩阵形式还为混合策略纳什均衡的求解提供了直观代数框架。纳什(1950)证明了任何有限矩阵形式博弈至少存在一个混合策略纳什均衡。核心条件为无差异原则:均衡时一方的混合策略须使对手选择任何正概率纯策略时获得相同期望支付。

性别之战(Battle of the Sexes)为例,该博弈存在两个纯策略纳什均衡及一个混合策略均衡。设女友以概率 pp 选拳击,男友以概率 qq 选拳击,根据无差异原则可解得 p=23p = \frac{2}{3}q=13q = \frac{1}{3}

局限性与扩展应用

矩阵形式无法处理序贯博弈中的行动顺序,也无法刻画信息集。在不完全信息博弈中,海萨尼的类型空间方法虽仍可用矩阵形式,但策略空间随类型数指数增长。在多重均衡时需借助帕累托占优风险占优等精炼标准进行选择。尽管如此,矩阵形式仍是产业组织拍卖理论机制设计等领域的基础分析工具——从古诺竞争伯特兰竞争,从公共品供给中的搭便车问题到多智能体系统中的对抗性博弈,矩阵形式提供了统一的策略分析语言。