ARTICLE
标准形式博弈
标准形式博弈(normal-form game),又称策略形式博弈(strategic-form game),是博弈论中最基础的博弈表示方式。它通过三个核心要素完整刻画一个静态博弈情境:参与者集合、每个参与者的纯策略空间、以及定义在所有策略组合上的效用函数(payoff function)。三要素缺一不可,共同构成博弈的完整描述。与扩展形式相比,标准形式舍弃
标准形式博弈(normal-form game),又称策略形式博弈(strategic-form game),是博弈论中最基础的博弈表示方式。它通过三个核心要素完整刻画一个静态博弈情境:参与者集合、每个参与者的纯策略空间、以及定义在所有策略组合上的效用函数(payoff function)。三要素缺一不可,共同构成博弈的完整描述。与扩展形式相比,标准形式舍弃了时序与信息结构,将博弈简化为策略与支付之间的函数关系,使其成为分析同时行动静态博弈的理想工具。标准形式也是学习更复杂博弈模型(如动态博弈、不完全信息博弈)的必经起点。
三要素的形式定义
设博弈有 个参与者,记参与者集合为 。对每个参与者 ,其纯策略空间为 ,表示该参与者所有可行策略的集合。一个策略组合(strategy profile) 描述了所有参与者各选一个策略后的完整局面。参与者 的效用函数 赋予每个策略组合一个实数值,反映 在该结果下的偏好排序。效用函数满足冯·诺依曼-摩根斯坦(von Neumann-Morgenstern)公理时,可进一步处理涉及风险与概率的混合策略情形,这为后续讨论混合策略纳什均衡奠定了公理化基础。
对于两人有限策略博弈,标准形式通常以支付矩阵(payoff matrix)呈现:行对应参与者 1 的策略,列对应参与者 2 的策略,每个单元格内有序数对 ,前者为行参与者的效用,后者为列参与者的效用。囚徒困境是经典范例——两个囚徒各可选择"坦白"或"抵赖",支付矩阵直观展示了个体理性与集体理性的冲突:各自追求最优却导致对双方都更差的结局。对于三人及以上的博弈,则需使用多维数组或分层表格表示,其复杂度随参与者人数指数增长。
核心解概念
严格占优(strict dominance):若对参与者 ,存在策略 使得无论对手选择何种策略,均有 对所有 和所有 成立,则 是严格占优策略。严格占优策略若存在,必然是理性参与者的唯一选择。更弱的版本是弱占优(weak dominance),将严格不等式替换为 且至少一个严格成立。逐次剔除严格劣策略(iterated elimination of strictly dominated strategies, IESDS)可逐步缩小均衡候选范围,其核心逻辑在于"理性参与者不会选择严格劣策略"这一常识(common knowledge)。但剔除顺序在弱占优下可能影响最终结果,需谨慎处理。
纳什均衡(Nash equilibrium):策略组合 满足对每个参与者 , 对所有 成立。即每个参与者单方面偏离无法提高自身效用。纳什均衡是标准形式博弈的核心预测概念,但并非所有博弈都有纯策略纳什均衡——匹配便士即为一例。纳什均衡的本质是最优反应对应(best response correspondence)的不动点,这一视角为均衡存在性的证明提供了拓扑学路径。
混合策略(mixed strategy):参与者在纯策略上的概率分布 ,其中 表示 上的所有概率分布的单纯形。此时期望效用为 。纳什定理(Nash, 1950)运用角谷不动点定理(Kakutani fixed-point theorem)证明,任何有限标准形式博弈都存在至少一个混合策略纳什均衡。这是博弈论中最深刻的结论之一。匹配便士(matching pennies)即为纯策略无均衡而混合策略存在唯一均衡 的经典案例。协调博弈(如性别战,Battle of the Sexes)则同时拥有纯策略和混合策略均衡,体现了多重均衡带来的协调问题。
与扩展形式的关系
标准形式将博弈抽象为策略与支付的一一对应,舍弃了时序与信息结构。扩展形式博弈(extensive-form game)通过博弈树刻画行动顺序和信息集,信息更丰富但维度更高。任一扩展形式博弈均可转化为等价的标准形式——将每个参与者的一个完整相机计划(contingent plan)映射为标准形式中的一个纯策略。然而这种转化存在维度爆炸问题:若扩展形式中每个信息集有 个行动, 个信息集,则标准形式纯策略数可达 。这一局限促使了子博弈完美均衡(subgame perfect equilibrium)和序列均衡(sequential equilibrium)等专为扩展形式设计的精炼概念的发展。反过来,标准形式的纳什均衡概念是这些精炼概念的共同理论基础。
应用与局限
标准形式博弈简洁直观,适用于单次、同时行动的静态场景——如密封拍卖、古诺竞争、伯特兰竞争、协调博弈和公共品博弈等。在产业组织理论中,古诺双寡头模型即为标准形式博弈的典型应用,企业同时选择产量,利润由市场逆需求函数决定。其核心局限在于无法区分行动时序:所有参与者被视为同时选择策略,即便现实中决策有先后。当行动顺序和信念更新至关重要时(如信号博弈、重复博弈),扩展形式是更合适的分析框架。此外,标准形式也无法直接刻画不完全信息;这类情境需借助贝叶斯博弈(Bayesian game)框架,将类型空间引入标准形式的建模之中。海萨尼转换(Harsanyi transformation)是连接完全信息与不完全信息博弈的桥梁。尽管如此,标准形式因其数学简洁性和纳什均衡理论的完备性,始终是博弈论教学与研究的逻辑起点,也是理解更复杂博弈模型的基础。