ARTICLE

标准形式博弈

标准形式博弈(normal-form game),又称策略形式博弈(strategic-form game),是博弈论中最基础的博弈表示方式。它通过三个核心要素完整刻画一个静态博弈情境:参与者集合、每个参与者的纯策略空间、以及定义在所有策略组合上的效用函数(payoff function)。三要素缺一不可,共同构成博弈的完整描述。与扩展形式相比,标准形式舍弃

浏览 0 更新 2025-11-08

标准形式博弈(normal-form game),又称策略形式博弈(strategic-form game),是博弈论中最基础的博弈表示方式。它通过三个核心要素完整刻画一个静态博弈情境:参与者集合、每个参与者的纯策略空间、以及定义在所有策略组合上的效用函数(payoff function)。三要素缺一不可,共同构成博弈的完整描述。与扩展形式相比,标准形式舍弃了时序与信息结构,将博弈简化为策略与支付之间的函数关系,使其成为分析同时行动静态博弈的理想工具。标准形式也是学习更复杂博弈模型(如动态博弈、不完全信息博弈)的必经起点。

三要素的形式定义

设博弈有 n n 个参与者,记参与者集合为 N={1,2,,n} N = \{1, 2, \ldots, n\} 。对每个参与者 iN i \in N ,其纯策略空间为 Si S_i ,表示该参与者所有可行策略的集合。一个策略组合(strategy profile)s=(s1,s2,,sn)S1×S2××Sn s = (s_1, s_2, \ldots, s_n) \in S_1 \times S_2 \times \cdots \times S_n 描述了所有参与者各选一个策略后的完整局面。参与者 i i 的效用函数 ui:S1××SnR u_i: S_1 \times \cdots \times S_n \to \mathbb{R} 赋予每个策略组合一个实数值,反映 i i 在该结果下的偏好排序。效用函数满足冯·诺依曼-摩根斯坦(von Neumann-Morgenstern)公理时,可进一步处理涉及风险与概率的混合策略情形,这为后续讨论混合策略纳什均衡奠定了公理化基础。

对于两人有限策略博弈,标准形式通常以支付矩阵(payoff matrix)呈现:行对应参与者 1 的策略,列对应参与者 2 的策略,每个单元格内有序数对 (u1,u2) (u_1, u_2) ,前者为行参与者的效用,后者为列参与者的效用。囚徒困境是经典范例——两个囚徒各可选择"坦白"或"抵赖",支付矩阵直观展示了个体理性与集体理性的冲突:各自追求最优却导致对双方都更差的结局。对于三人及以上的博弈,则需使用多维数组或分层表格表示,其复杂度随参与者人数指数增长。

核心解概念

严格占优(strict dominance):若对参与者 i i ,存在策略 si s_i^* 使得无论对手选择何种策略,均有 ui(si,si)>ui(si,si) u_i(s_i^*, s_{-i}) > u_i(s_i', s_{-i}) 对所有 sisi s_i' \neq s_i^* 和所有 si s_{-i} 成立,则 si s_i^* 是严格占优策略。严格占优策略若存在,必然是理性参与者的唯一选择。更弱的版本是弱占优(weak dominance),将严格不等式替换为 \geq 且至少一个严格成立。逐次剔除严格劣策略(iterated elimination of strictly dominated strategies, IESDS)可逐步缩小均衡候选范围,其核心逻辑在于"理性参与者不会选择严格劣策略"这一常识(common knowledge)。但剔除顺序在弱占优下可能影响最终结果,需谨慎处理。

纳什均衡(Nash equilibrium):策略组合 s s^* 满足对每个参与者 i i ui(si,si)ui(si,si) u_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*) 对所有 siSi s_i \in S_i 成立。即每个参与者单方面偏离无法提高自身效用。纳什均衡是标准形式博弈的核心预测概念,但并非所有博弈都有纯策略纳什均衡——匹配便士即为一例。纳什均衡的本质是最优反应对应(best response correspondence)的不动点,这一视角为均衡存在性的证明提供了拓扑学路径。

混合策略(mixed strategy):参与者在纯策略上的概率分布 σiΔ(Si) \sigma_i \in \Delta(S_i) ,其中 Δ(Si) \Delta(S_i) 表示 Si S_i 上的所有概率分布的单纯形。此时期望效用为 E[ui(σi,σi)]=sSui(s)jNσj(sj) \mathbb{E}[u_i(\sigma_i, \sigma_{-i})] = \sum_{s \in S} u_i(s) \prod_{j \in N} \sigma_j(s_j) 。纳什定理(Nash, 1950)运用角谷不动点定理(Kakutani fixed-point theorem)证明,任何有限标准形式博弈都存在至少一个混合策略纳什均衡。这是博弈论中最深刻的结论之一。匹配便士(matching pennies)即为纯策略无均衡而混合策略存在唯一均衡 (12,12) \left(\frac{1}{2}, \frac{1}{2}\right) 的经典案例。协调博弈(如性别战,Battle of the Sexes)则同时拥有纯策略和混合策略均衡,体现了多重均衡带来的协调问题。

与扩展形式的关系

标准形式将博弈抽象为策略与支付的一一对应,舍弃了时序与信息结构。扩展形式博弈(extensive-form game)通过博弈树刻画行动顺序和信息集,信息更丰富但维度更高。任一扩展形式博弈均可转化为等价的标准形式——将每个参与者的一个完整相机计划(contingent plan)映射为标准形式中的一个纯策略。然而这种转化存在维度爆炸问题:若扩展形式中每个信息集有 k k 个行动,m m 个信息集,则标准形式纯策略数可达 km k^m 。这一局限促使了子博弈完美均衡(subgame perfect equilibrium)和序列均衡(sequential equilibrium)等专为扩展形式设计的精炼概念的发展。反过来,标准形式的纳什均衡概念是这些精炼概念的共同理论基础。

应用与局限

标准形式博弈简洁直观,适用于单次、同时行动的静态场景——如密封拍卖、古诺竞争、伯特兰竞争、协调博弈和公共品博弈等。在产业组织理论中,古诺双寡头模型即为标准形式博弈的典型应用,企业同时选择产量,利润由市场逆需求函数决定。其核心局限在于无法区分行动时序:所有参与者被视为同时选择策略,即便现实中决策有先后。当行动顺序和信念更新至关重要时(如信号博弈、重复博弈),扩展形式是更合适的分析框架。此外,标准形式也无法直接刻画不完全信息;这类情境需借助贝叶斯博弈(Bayesian game)框架,将类型空间引入标准形式的建模之中。海萨尼转换(Harsanyi transformation)是连接完全信息与不完全信息博弈的桥梁。尽管如此,标准形式因其数学简洁性和纳什均衡理论的完备性,始终是博弈论教学与研究的逻辑起点,也是理解更复杂博弈模型的基础。