ARTICLE

博弈

博弈 (Game Theory) 博弈论(Game Theory),又称对策论或赛局理论,是研究多个理性决策者在相互依赖的交互情境下如何做出最优策略选择的数学理论与分析框架。其核心在于"策略相互依存"——一个人的最优选择取决于他人的选择。1944年冯·诺依曼与摩根斯特恩合著的《博弈论与经济行为》为其建立了公理化框架,1950年代纳什提出纳什均衡概念,将博弈论

浏览 4 更新 2025-10-26

博弈 (Game Theory)

博弈论(Game Theory),又称对策论或赛局理论,是研究多个理性决策者在相互依赖的交互情境下如何做出最优策略选择的数学理论与分析框架。其核心在于"策略相互依存"——一个人的最优选择取决于他人的选择。1944年冯·诺依曼摩根斯特恩合著的《博弈论与经济行为》为其建立了公理化框架,1950年代纳什提出纳什均衡概念,将博弈论从二人零和博弈拓展到任意数量参与者的非合作博弈,奠定了现代博弈论的基石。

基本要素与分类

博弈由三大要素构成:参与人(players)、策略集(strategies)、收益函数(payoffs)。分析目标是预测参与人的策略选择及其稳定性。从分类角度看:合作博弈允许有约束力的协议(如联盟形成);非合作博弈则各自为战,纳什均衡是其主要解概念。静态博弈中参与人同时行动(如囚徒困境);动态博弈存在先后顺序,常用子博弈完美均衡作为解概念。完全信息博弈中所有参与人知晓彼此的收益;不完全信息博弈则通过海萨尼框架转化为贝叶斯博弈零和博弈中一方的所得等于另一方的所失;非零和博弈中参与人可同时获益或受损。

核心解概念

纳什均衡

纳什均衡是最根本的解概念:若任何参与人单方面偏离自己的策略都无法获得更高收益,则称该策略组合为纳什均衡。纳什用不动点定理证明了有限策略博弈中混合策略纳什均衡总是存在。然而纳什均衡存在两大局限:一是多重均衡时的选择问题;二是不要求均衡之外的威胁可信。子博弈完美均衡通过在动态博弈中剔除不可置信威胁来弥补第二个局限——在位企业宣称"你敢进入我就打价格战",但进入真的发生时,理性在位者未必会执行这一两败俱伤的威胁。

贝叶斯博弈

在拍卖、信号传递等不完全信息场景中,海萨尼引入"自然"先选择参与人的类型。贝叶斯纳什均衡要求每个类型下的参与人在给定信念下选择最优行动。拍卖理论是其最成功的应用之一:密封投标中每个竞标者不知对手估价但知概率分布,最优出价策略需要在对对手信念的基础上优化自身收益。

经典模型

囚徒困境

两名嫌犯被隔离审讯,每人可选合作(沉默)或背叛(供认)。从个体理性出发,背叛是优势策略,但双方都背叛的结果劣于双方都合作——这就是"个体理性导致集体非理性"的核心悖论。该模型揭示了公共品供给不足、军备竞赛和价格战的深层逻辑。

协调博弈与聚点

在协调博弈中,参与人有共同利益去选择一致行动,但存在多个可能的协调方案。谢林提出"聚点"(focal point)概念:在没有沟通时,某些解因文化显著性而自然成为共同预期——让两人各自在纽约选见面地点,大多数人会不约而同选择中央车站。聚点理论对理解制度形成和社会规范具有重要价值。

鹰鸽博弈

鹰派侵略、鸽派退让。鹰鹰相遇两败俱伤;鹰遇鸽则鹰获全胜;两鸽相遇平分资源。该模型在生物学中被用来解释动物冲突中的克制行为——演化稳定策略使种群中鹰和鸽维持一定比例。在经济学中可类比于市场竞争中的激进与保守策略选择。

演化博弈

演化博弈论放弃完全理性假设,研究策略如何在群体中通过学习和复制过程演化。演化稳定策略(ESS)指若整个群体采取某一策略,任何少数突变策略都无法入侵。在重复囚徒困境中,"以牙还牙"策略(Tit-for-Tat)在多次演化竞赛中胜出,因其兼顾了善良(绝不先背叛)、报复(立即反击)、宽恕(若对手恢复合作则原谅)和透明(行为可预测)四个特征。

应用领域

经济学与产业组织:寡头定价、拍卖设计、机制设计。2020年诺贝尔经济学奖授予米尔格罗姆威尔逊,表彰其改进拍卖理论并应用于频谱拍卖设计。政治学与国际关系核威慑本质上是一个相互确保摧毁的博弈均衡。生物学:演化博弈论解释了利他主义、领地行为和性选择。计算机科学:AlphaGo的棋类博弈树搜索、互联网广告竞价排名系统均是博弈论在工程层面的实现。

局限性

首先,完全理性假设在现实中常不成立——最后通牒博弈中人们对不公平分配的自发性惩罚行为系统性地偏离了理论预测,行为博弈论由此发展。其次,多纳什均衡的存在削弱了预测力。第三,博弈论以稳态分析为主,对动态过程解释力有限。最后,现实中的收益难以量化,策略空间往往开放且连续。博弈论最深刻的价值在于它教会人们一种思维框架:在决策之前站在他人角度思考——"我知道他知道我知道什么,然后我该怎么做。"这种策略性思维,正是博弈论对人类理性最持久的馈赠。