ARTICLE
非合作博弈理论
非合作博弈理论 (Non-cooperative Game Theory) 非合作博弈理论 (Non-cooperative Game Theory) 是博弈论 (Game Theory) 两大分支之一,专注于研究多个理性决策者在无法达成具有约束力协议(binding agreements)时的策略互动。该理论由约翰·纳什 (John Nash) 在1950
非合作博弈理论 (Non-cooperative Game Theory)
非合作博弈理论 (Non-cooperative Game Theory) 是博弈论 (Game Theory) 两大分支之一,专注于研究多个理性决策者在无法达成具有约束力协议(binding agreements)时的策略互动。该理论由约翰·纳什 (John Nash) 在1950年代奠定数学基础,莱因哈德·泽尔腾 (Reinhard Selten) 和约翰·海萨尼 (John Harsanyi) 进一步拓展,三人因此在1994年共同获得诺贝尔经济学奖。非合作博弈的核心问题是:当每个参与者独立选择策略且无法强制他人遵守约定时,会产生怎样的结果?
基本要素
每个非合作博弈包含三个核心要素:参与者 (Players) 即做出决策的个体或团体;策略 (Strategies) 即每个参与者可选行动的集合 ,全体策略组合构成一个策略向量 ;支付 (Payoffs) 即参与者在特定策略组合下获得的效用 。博弈可按行动顺序分为静态博弈 (static game) 与动态博弈 (dynamic game),按信息结构分为完全信息博弈 (complete information) 与不完全信息博弈 (incomplete information)。
纳什均衡
纳什均衡 (Nash Equilibrium) 是非合作博弈的核心解概念。一个策略组合 是纳什均衡,当且仅当每个参与者的策略都是对其他参与者策略的最优反应,无人能通过单方面偏离获益:
纳什均衡的深刻意义在于它提供了一个自我实施(self-enforcing)的结果预测。
博弈的表示形式
策略型 (Strategic Form) 使用支付矩阵 (Payoff Matrix) 表示博弈,适用于静态博弈。最经典的案例是囚徒困境 (Prisoner's Dilemma):两名嫌犯独立选择合作或背叛,理性个体最终均选择背叛,揭示了个人理性与集体理性的冲突。扩展型 (Extensive Form) 使用博弈树 (Game Tree) 表示,包含决策节点、分支和信息集,适用于动态博弈。
完全信息静态博弈
在完全信息静态博弈中,参与者同时行动且知晓彼此支付。严格占优策略 (strictly dominant strategy) 指无论他人如何行动都是最优的策略。囚徒困境中"背叛"即为占优策略。可通过重复剔除严格劣策略 (iterated elimination of strictly dominated strategies) 简化博弈,若收敛到唯一组合则为纳什均衡。
完全信息动态博弈
对于动态博弈,子博弈精炼纳什均衡 (Subgame Perfect Nash Equilibrium, SPNE) 由泽尔腾提出,要求策略组合在每个子博弈上都是纳什均衡,从而排除了不可置信威胁。求解标准方法是逆向归纳法 (Backward Induction):从博弈树末端逐层向前推导最优选择。
不完全信息博弈
海萨尼通过海萨尼转换 (Harsanyi Transformation) 处理不完全信息:引入虚拟"自然" (Nature) 决定参与者类型 (type),将不完全信息转化为不完全但完美的信息。在此框架下,贝叶斯纳什均衡 (Bayesian Nash Equilibrium) 要求每个参与者在给定类型和关于他人类型的信念下最大化期望效用。
应用与意义
非合作博弈理论广泛应用于经济学(古诺模型 Cournot Model、拍卖理论 Auction Theory、机制设计理论 Mechanism Design)、政治学(投票行为、军备竞赛)和进化生物学(进化博弈论 Evolutionary Game Theory)。该理论最重要的洞见在于:个体理性不一定导致集体理性——囚徒困境恰恰揭示了这一深刻矛盾,深刻改变了现代经济学的研究范式。