ARTICLE
标准式博弈
标准式博弈 (Normal-Form Game) 标准式博弈(Normal-Form Game),又称策略式博弈(Strategic-Form Game),是博弈论中最基础的博弈表示形式。它将一个博弈精简为三个核心要素:参与者(Players)、每个参与者可选的策略(Strategies)、以及对应于每种策略组合的支付(Payoffs)。标准式博弈舍弃了行动
标准式博弈 (Normal-Form Game)
标准式博弈(Normal-Form Game),又称策略式博弈(Strategic-Form Game),是博弈论中最基础的博弈表示形式。它将一个博弈精简为三个核心要素:参与者(Players)、每个参与者可选的策略(Strategies)、以及对应于每种策略组合的支付(Payoffs)。标准式博弈舍弃了行动顺序、信息结构等动态细节,仅聚焦于策略与结果之间的映射关系,因此特别适合分析同时决策的静态博弈。
形式化定义
一个标准式博弈由三元组 表示:
- 为有限的参与者集合。
- 为参与者 的策略空间(Strategy Set),可以是有限或无限集合。
- 为参与者 的支付函数(Payoff Function),为每种策略组合 赋予一个实数效用值。
对于两人有限博弈,标准式常用支付矩阵(Payoff Matrix)表示:行对应参与者 1 的策略,列对应参与者 2 的策略,每一格填写 。
经典示例:囚徒困境
最著名的标准式博弈是囚徒困境(Prisoner's Dilemma)。两个犯罪嫌疑人分别被审讯,每人可选"坦白"(Confess)或"抵赖"(Deny)。支付矩阵如下:
- 若两人都抵赖:各判 1 年(支付 )。
- 若一人坦白一人抵赖:坦白者释放(0),抵赖者判 10 年()。
- 若两人都坦白:各判 5 年()。
占优策略(Dominant Strategy)分析表明:无论对方如何选择,"坦白"始终是每个参与者的严格占优策略。因此该博弈的纳什均衡为(坦白,坦白),尽管(抵赖,抵赖)对双方而言是帕累托更优的结果。这一矛盾揭示了个人理性与集体理性之间的根本张力,是社会科学中理解合作困境的核心模型。
解概念:纳什均衡
标准式博弈的核心解概念是纳什均衡(Nash Equilibrium)。策略组合 构成一个纳什均衡,当且仅当每个参与者的策略都是对其他参与者策略的最优反应:
纳什定理(Nash, 1950)证明:任何有限标准式博弈都存在至少一个纳什均衡(允许混合策略)。混合策略(Mixed Strategy)指参与者以某种概率分布在纯策略上进行随机选择,扩展了标准式博弈的策略空间。
与展开式博弈的关系
标准式博弈与展开式博弈(Extensive-Form Game)是博弈的两种互补表示。展开式博弈用博弈树刻画行动顺序、信息集和动态决策过程,信息更丰富;但任何展开式博弈都可以转化为一个等价的标准式博弈,方法是将每个参与者的策略定义为"在每个信息集上的完整行动计划"。这一转化由 Kuhn 定理保证,但也可能导致策略数量指数级膨胀。
在经济学中的应用
标准式博弈广泛应用于:寡头竞争(古诺模型和伯川德模型均可写成标准式)、拍卖设计(竞标者的出价策略构成标准式博弈)、公共品供给(自愿贡献博弈刻画搭便车问题)、国际关系(军备竞赛、贸易谈判等)。标准式博弈以其简洁的结构,为分析策略互动提供了统一的数学语言,是整个博弈论大厦的逻辑出发点。