ARTICLE

标准式博弈

标准式博弈 (Normal-Form Game) 标准式博弈(Normal-Form Game),又称策略式博弈(Strategic-Form Game),是博弈论中最基础的博弈表示形式。它将一个博弈精简为三个核心要素:参与者(Players)、每个参与者可选的策略(Strategies)、以及对应于每种策略组合的支付(Payoffs)。标准式博弈舍弃了行动

浏览 0 更新 2025-12-02

标准式博弈 (Normal-Form Game)

标准式博弈(Normal-Form Game),又称策略式博弈(Strategic-Form Game),是博弈论中最基础的博弈表示形式。它将一个博弈精简为三个核心要素:参与者(Players)、每个参与者可选的策略(Strategies)、以及对应于每种策略组合的支付(Payoffs)。标准式博弈舍弃了行动顺序、信息结构等动态细节,仅聚焦于策略与结果之间的映射关系,因此特别适合分析同时决策的静态博弈。

形式化定义

一个标准式博弈由三元组 Γ=N,(Si)iN,(ui)iN\Gamma = \langle N, (S_i)_{i \in N}, (u_i)_{i \in N} \rangle 表示:

  • N={1,2,,n}N = \{1, 2, \ldots, n\} 为有限的参与者集合。
  • SiS_i 为参与者 ii 的策略空间(Strategy Set),可以是有限或无限集合。
  • ui:S1×S2××SnRu_i: S_1 \times S_2 \times \cdots \times S_n \to \mathbb{R} 为参与者 ii支付函数(Payoff Function),为每种策略组合 (s1,,sn)(s_1, \ldots, s_n) 赋予一个实数效用值。

对于两人有限博弈,标准式常用支付矩阵(Payoff Matrix)表示:行对应参与者 1 的策略,列对应参与者 2 的策略,每一格填写 (u1,u2)(u_1, u_2)

经典示例:囚徒困境

最著名的标准式博弈是囚徒困境(Prisoner's Dilemma)。两个犯罪嫌疑人分别被审讯,每人可选"坦白"(Confess)或"抵赖"(Deny)。支付矩阵如下:

  • 若两人都抵赖:各判 1 年(支付 1,1-1, -1)。
  • 若一人坦白一人抵赖:坦白者释放(0),抵赖者判 10 年(10-10)。
  • 若两人都坦白:各判 5 年(5,5-5, -5)。

占优策略(Dominant Strategy)分析表明:无论对方如何选择,"坦白"始终是每个参与者的严格占优策略。因此该博弈的纳什均衡为(坦白,坦白),尽管(抵赖,抵赖)对双方而言是帕累托更优的结果。这一矛盾揭示了个人理性与集体理性之间的根本张力,是社会科学中理解合作困境的核心模型。

解概念:纳什均衡

标准式博弈的核心解概念是纳什均衡(Nash Equilibrium)。策略组合 s=(s1,,sn)s^* = (s_1^*, \ldots, s_n^*) 构成一个纳什均衡,当且仅当每个参与者的策略都是对其他参与者策略的最优反应:

ui(si,si)ui(si,si),siSi,  iNu_i(s_i^*, s_{-i}^*) \ge u_i(s_i, s_{-i}^*), \quad \forall s_i \in S_i, \; \forall i \in N

纳什定理(Nash, 1950)证明:任何有限标准式博弈都存在至少一个纳什均衡(允许混合策略)。混合策略(Mixed Strategy)指参与者以某种概率分布在纯策略上进行随机选择,扩展了标准式博弈的策略空间。

与展开式博弈的关系

标准式博弈与展开式博弈(Extensive-Form Game)是博弈的两种互补表示。展开式博弈用博弈树刻画行动顺序、信息集和动态决策过程,信息更丰富;但任何展开式博弈都可以转化为一个等价的标准式博弈,方法是将每个参与者的策略定义为"在每个信息集上的完整行动计划"。这一转化由 Kuhn 定理保证,但也可能导致策略数量指数级膨胀。

在经济学中的应用

标准式博弈广泛应用于:寡头竞争古诺模型伯川德模型均可写成标准式)、拍卖设计(竞标者的出价策略构成标准式博弈)、公共品供给(自愿贡献博弈刻画搭便车问题)、国际关系(军备竞赛、贸易谈判等)。标准式博弈以其简洁的结构,为分析策略互动提供了统一的数学语言,是整个博弈论大厦的逻辑出发点。