规范形 (Normal Form)
规范形(Normal Form,也称策略形,Strategic Form)是博弈论中描述博弈的最基本方式。它将一个博弈抽象为三个核心要素的集合:玩家集合、每个玩家的策略空间以及定义在所有策略组合上的支付函数。规范形博弈凝练地刻画了策略互动的结构性信息——谁参与、各自能做什么、结果如何——而不描述行动的先后顺序或信息结构。这种表示方法是定义纳什均衡、研究占优策略和分析静态博弈的标准框架。
定义
一个有限 n 人规范形博弈由三元组 G=⟨N,{Si}i∈N,{ui}i∈N⟩ 定义:
- N={1,2,…,n} 为玩家集合。
- 对每个玩家 i∈N,Si 是其纯策略空间(亦称策略集)。
- 对每个玩家 i∈N,ui:S1×S2×⋯×Sn→R 是其支付函数(Payoff Function),它将每一个策略组合映射为玩家 i 的效用或收益。
令 S=∏i=1nSi 为所有策略组合(Strategy Profile)的集合。常记 s=(s1,…,sn)∈S,并采用记号 s−i=(s1,…,si−1,si+1,…,sn) 表示除玩家 i 外其他玩家的策略。此时 ui(si,s−i) 表示当玩家 i 选择 si 而其他玩家选择 s−i 时玩家 i 的支付。
二人有限博弈的矩阵表示
当只有两名玩家且策略集为有限集时,规范形博弈通常以支付矩阵(Payoff Matrix 或 Bimatrix)的形式呈现。以经典的囚徒困境为例:
坦白抵赖坦白(−5,−5)(−10,0)抵赖(0,−10)(−1,−1)
行代表玩家 1 的策略,列代表玩家 2 的策略,矩阵的每个单元格 (a,b) 表示行玩家和列玩家分别获得的支付。这种表示直观且便于分析有限博弈的均衡。
对于三人或更多玩家,支付用多维数组(张量)表示,维度随玩家数量指数增长,这是规范形表示的一个实际局限。
混合策略
在许多博弈中,纯策略空间上的纳什均衡可能不存在。为此,需要将策略概念从纯策略扩展为混合策略。
玩家 i 的一个混合策略 σi 是其纯策略集 Si 上的一个概率分布:
σi∈Δ(Si)={σi∈R∣Si∣:si∈Si∑σi(si)=1,σi(si)≥0}
即 σi(si) 表示玩家 i 以概率 σi(si) 选择纯策略 si。所有玩家的混合策略构成混合策略组合 σ=(σ1,…,σn)。玩家 i 在混合策略组合 σ 下的期望支付为:
Ui(σ)=s∈S∑[j=1∏nσj(sj)]ui(s)
纳什均衡
规范形博弈中最重要的解概念是纳什均衡。定义玩家 i 的最优反应对应(Best Response Correspondence)为:
BRi(s−i)={si∈Si:ui(si,s−i)≥ui(si′,s−i),∀si′∈Si}
给定规范形博弈 ⟨N,{Si},{ui}⟩,策略组合 s∗=(s1∗,…,sn∗) 是一个纯策略纳什均衡当且仅当:
ui(si∗,s−i∗)≥ui(si,s−i∗),∀si∈Si,∀i∈N
等价地,si∗∈BRi(s−i∗) 对所有 i 成立——纳什均衡本质上是各玩家最优反应的"不动点"。即每个玩家在给定其他玩家策略不变的情况下,单方面偏离不能获得更高支付。纳什均衡是博弈论中理性行为的核心基准,广泛应用于寡头市场分析、拍卖理论和机制设计等领域。
严格占优与被占优策略
规范形表示便于分析策略间的占优关系:
- 纯策略 si 严格占优纯策略 si′,若对任意 s−i,恒有 ui(si,s−i)>ui(si′,s−i)。被严格占优的策略永远不会被理性玩家选择,可以通过重复剔除严格被占优策略(Iterated Elimination of Strictly Dominated Strategies)逐步简化博弈。
- 若每个玩家都有严格占优策略,则该策略组合构成博弈的唯一纳什均衡,典型例子是囚徒困境中的(坦白, 坦白)。
- 当重复剔除非严格被占优策略时,剔除顺序可能影响最终结果,这是该方法的局限性。
规范形与展开形的比较
规范形是展开形博弈(Extensive Form Games)的互补表示。两者各有侧重:
- 规范形:高度抽象,压缩了行动顺序和信息结构,仅保留策略与支付的映射关系。适合分析同时行动博弈和定义纳什均衡,但对信息不完全或顺序行动的刻画力不足。
- 展开形:使用博弈树显式表征行动的先后顺序、各节点的信息集和可选行动。适合分析子博弈精炼均衡、序贯理性和信号博弈等涉及信息结构的博弈情境。
每一个展开形博弈都可以通过"策略化"转换为一个规范形博弈——令每个玩家的策略为其在每个信息集上的行动计划的完整规定。但转换后的规范形可能丢失原始展开形的许多结构信息(如策略的序贯关系),且策略数量随信息集个数呈指数增长。因此,两种表示各就其位:规范形适合"一锤子"同时决策场景,展开形适合多阶段、有信息不对称的动态博弈。
应用与局限
规范形博弈是博弈论教学的起点,其矩阵表现形式直观清晰,便于手工计算二人博弈的纳什均衡。对于有限二人博弈,寻找混合策略纳什均衡的标准方法是:固定对手的混合策略,令己方各纯策略的期望支付相等,由此解出对手的均衡混合概率。在理论层面,纳什存在性定理正是建立在规范形框架上:任何具有有限玩家集和紧凸策略空间、拟凹连续支付函数的规范形博弈,均存在混合策略纳什均衡,其证明依赖于角谷不动点定理在最优反应对应上的应用。
然而,规范形的主要局限性在于"维数灾难":当玩家数量或策略数量增加时,支付矩阵的规模呈指数膨胀,使存储和分析变得不可行。此外,规范形将所有策略视为原子化的选项集合,忽略了一个策略往往是"如果……则……"的条件计划这一事实,而这恰恰是展开形的优势所在。因此,在实际建模中,研究者应根据博弈的信息结构和行动时序,恰当选择规范形或展开形作为分析框架。