ARTICLE

有限博弈

有限博弈 (Finite Game) 有限博弈是博弈论中最基础的一类博弈形式,指参与人数量有限、每个参与人的纯策略集合有限、且博弈的阶段或回合数也有限的博弈。这一概念为纳什均衡的存在性定理提供了必要条件,构成了非合作博弈理论的核心分析框架。有限博弈不仅涵盖了囚徒困境、协调博弈等经典模型,也是策梅洛定理和有限重复博弈等进阶主题的逻辑起点。 形式化定义与两种标准

浏览 0 更新 2026-07-12

有限博弈 (Finite Game)

有限博弈博弈论中最基础的一类博弈形式,指参与人数量有限、每个参与人的纯策略集合有限、且博弈的阶段或回合数也有限的博弈。这一概念为纳什均衡的存在性定理提供了必要条件,构成了非合作博弈理论的核心分析框架。有限博弈不仅涵盖了囚徒困境、协调博弈等经典模型,也是策梅洛定理和有限重复博弈等进阶主题的逻辑起点。

形式化定义与两种标准表示

有限博弈的形式化定义包含三个要素:

  • 参与人集合 N={1,2,,n} N = \{1, 2, \ldots, n\} ,其中 n n 为有限正整数。
  • 每个参与人 i i 的纯策略空间 Si S_i 为有限集。
  • 若为动态博弈,博弈的阶段数有限,且每个信息集上的可选行动数为有限。

有限博弈可表示为两种标准形式。策略式(或正规式)用一个 n n 维支付矩阵来描述:每个参与人同时选择一个纯策略,所有策略组合对应一个支付向量。展开式则用博弈树表示行动的先后顺序和信息结构。根据库恩定理 (Kuhn's Theorem),任意有限展开式博弈都可以转化为一个等价的有限策略式博弈——尽管策略数量可能随信息集数量呈指数级增长。两种表示各有优势:策略式便于分析纳什均衡,展开式便于刻画时序与信息结构。

纳什定理:有限博弈的基石

有限博弈最重要的理论结果是纳什定理 (纳什, 1950):任何有 n n 个参与人的有限博弈都存在至少一个纳什均衡,可能包含混合策略。混合策略是纯策略空间上的概率分布,其引入将离散的策略空间扩展为连续且紧致的单纯形,从而使不动点论证成为可能。

纳什的证明使用了角谷静夫不动点定理:在混合策略单纯形构成的策略空间上,最优反应对应 (best-response correspondence) 满足凸值性和上半连续性条件,因此存在不动点,该不动点即纳什均衡。这一定理奠定了现代博弈论的数学基础——它表明:即使在纯策略纳什均衡不存在的情况下(如猜硬币博弈),混合策略均衡也必然存在。然而,纳什定理仅保证存在性,不提供均衡的唯一性或如何达到均衡的信息,这引出了均衡精炼演化博弈论的后续研究方向。

经典实例

囚徒困境是二人二策略有限博弈的典型:支付矩阵的特定结构——背叛是严格占优策略——导致唯一纳什均衡为(背叛,背叛),尽管(合作,合作)对双方都帕累托更优。这揭示了个人理性与集体理性的深层冲突。

协调博弈如"猎鹿博弈",存在两个纯策略纳什均衡——一个帕累托占优(共同猎鹿),一个风险占优(各自猎兔)。有限博弈的多重均衡问题催生了均衡选择理论谢林点 (Schelling point) 等概念。

性别战中,两个参与人偏好协调但存在利益冲突:两个不对称的纯策略纳什均衡和一个对称的混合策略均衡并存。这类博弈是分析制度、惯例和文化规范如何解决协调问题的起点。

策梅洛定理与完美信息博弈

对于有限二人零和完美信息博弈,策梅洛定理 (策梅洛, 1913) 提供了一个比纳什定理更强的结论:博弈的结果是严格确定的——双方均采用最优策略时,要么先手必胜,要么后手必胜,要么双方必成平局。该定理可用逆向归纳法 (backward induction) 从终节点向上逐级证明:每一步的最优行动均可被确定,不存在策略循环。策梅洛定理原则上适用于国际象棋和围棋等有限博弈,但因搜索空间过大(围棋合法局面数约 10170 10^{170} )而无法在实践中穷举所有路径。

有限重复博弈与连锁店悖论

有限重复博弈是有限阶段博弈的 T T 次重复进行,总支付为各阶段支付的贴现值之和。其关键结论由塞尔腾 (Selten) 提出:若阶段博弈有唯一的纳什均衡,则有限次重复博弈的唯一子博弈精炼均衡是每个阶段都重复该均衡。这就是著名的"连锁店悖论":有限重复囚徒困境中,逆向归纳从最后一期开始——双方都意识到最后一期等价于单次博弈,因此必然背叛;向前递推导致合作在第一期即崩溃。

这一结论与无穷重复博弈形成鲜明对比。在无穷重复博弈中,无名氏定理 (Folk Theorem) 表明:只要贴现因子 δ \delta 足够大,任何可行且个人理性的支付向量都可以作为子博弈精炼均衡而实现,包括双方持续合作的帕累托最优结果。有限与无穷重复博弈的合作可能性差异深刻地揭示了时间视野对策略行为的决定性影响:当互动有已知终期时,合作的逻辑基础被逆向归纳瓦解。

有限博弈与无限博弈的哲学区分

詹姆斯·卡斯 (James P. Carse) 在其1986年著作《有限与无限的游戏》中提出了一个超越数学定义的哲学区分:有限博弈以取胜为目标,由固定规则和时间边界限定;无限博弈以延续游戏本身为目标,规则可随时间变化。商业竞争、地缘政治和学习过程均可被重新理解为无限博弈——这在管理学和战略研究中产生了广泛影响。尽管这一区分并非博弈论的正式内容,但它与有限/无限重复博弈的数学性质之间存在概念上的呼应:前者追问"如何在边界内取胜",后者追问"如何使博弈永不终结"。

批评与扩展

有限博弈框架面临若干限制。其一,纯策略空间有限的要求排除了拍卖、伯川德价格竞争等连续策略空间的重要博弈类,这些博弈需借助吉诺-德布鲁定理推广纳什存在性;其二,纳什均衡的存在性在部分连续博弈中也成立——条件被放宽为支付函数的拟凹性和策略空间的紧致性,有限性由此被扩展为更一般的数学条件。其三,实验经济学表明真实决策者并非总能达到纳什均衡:行为博弈论纳入认知限制、利他主义不平等厌恶等社会偏好来解释系统性偏离。尽管如此,有限博弈作为博弈论的公理起点——如同欧几里得几何之于数学——仍然是整个分析框架不可绕过的逻辑基础,也是通向机制设计契约理论信息经济学等应用领域的第一级阶梯。