ARTICLE
动态博弈
动态博弈 (Dynamic Game) 动态博弈(Dynamic Game)是博弈论的核心分支,研究参与人在不同时间点按顺序做出决策的战略互动。与所有参与人同时决策的静态博弈不同,动态博弈的本质特征在于行动的序列性(Sequentiality)和信息传递性(Information Transmission):后行动的参与人可以观察到先行动者已采取的行动,并据
动态博弈 (Dynamic Game)
动态博弈(Dynamic Game)是博弈论的核心分支,研究参与人在不同时间点按顺序做出决策的战略互动。与所有参与人同时决策的静态博弈不同,动态博弈的本质特征在于行动的序列性(Sequentiality)和信息传递性(Information Transmission):后行动的参与人可以观察到先行动者已采取的行动,并据此调整自身策略。这种时序维度使威胁的可信性、承诺的约束力以及声誉的长期价值成为分析焦点,为理解企业进入与市场反击、国际谈判与制裁、委托代理中的激励合同、法律程序中的诉讼与和解等现实战略互动提供了贴切框架。
扩展式表述与博弈树
动态博弈的标准描述工具是扩展式表述(Extensive Form Representation),即博弈树(Game Tree),由四类要素构成:
节点(Nodes)分为三种:博弈起点的初始节点、轮到特定参与人决策的决策节点,以及标注各参与人最终收益的终点节点。每个终点节点对应收益向量 。枝(Branches)连接相邻节点,代表决策节点上可供选择的行动。
信息集(Information Sets)是理解动态博弈的核心概念。一个信息集是同一参与人的若干决策节点的集合。当轮到该参与人行动时,若其身处包含多个节点的信息集,意味着他无法确切区分博弈已到达哪个具体节点。若博弈中每个信息集均只含单一决策节点,则为完美信息博弈(如象棋和围棋),每位参与人始终清楚博弈的完整历史;否则为不完美信息博弈,至少一位参与人在决策时面临信息不完全。
子博弈精炼纳什均衡
纳什均衡在动态环境中存在严重缺陷:某些均衡依赖于不可信威胁(Non-credible Threat),即参与人宣称将在某决策点采取的行动,实际对该参与人自身不利,理性的参与人不会执行。为排除这类虚假均衡,博弈论发展出子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium, SPNE)。
子博弈(Subgame)始于仅含单个决策节点的信息集,包含该节点之后所有节点与分枝,且不分割任何信息集。SPNE要求策略组合在原始博弈的每一个子博弈中均构成纳什均衡——即便该子博弈在均衡路径上不会实际到达。这一"处处最优"的要求自动筛除了所有不可信威胁:一个不可信威胁在其对应子博弈中不是最优选择,因此不可能成为该子博弈的纳什均衡。
逆向归纳法与市场进入博弈
有限完美信息动态博弈的SPNE可通过逆向归纳法(Backward Induction)求解。步骤为:从最接近终点节点的决策节点出发,确定该处行动者的最优选择;将该最优路径对应的收益"剪枝"向上替代原节点;回溯至前一阶段重复此过程,直至抵达初始节点。所有回溯确定的最优行动即构成SPNE。
以经典的市场进入博弈为例:进入者先选择进入或不进入;若进入,在位者选择斗争或默许。收益为:不进入时进入者得 、在位者得 ;进入后若斗争双方各得 ,若默许各得 。从第二阶段逆向分析:在位者比较默许的收益 与斗争的收益 ,必然选择默许。回到第一阶段:进入者预见到理性在位者将默许,因此比较进入收益 与不进入收益 ,选择进入。SPNE为(进入,默许),均衡收益 。注意(不进入,斗争)也是一个纳什均衡——它依赖于在位者"你敢进入我就斗争"的威胁,但该威胁不可信,因此不是SPNE。此例清晰展示了SPNE相对于纳什均衡的筛选力。
重复博弈
重复博弈是动态博弈的重要特例:同一静态博弈(阶段博弈)重复进行多期,参与人可依据历史行动调整策略。在有限重复博弈中,若阶段博弈有唯一纳什均衡,逆向归纳法迫使每期均重复该均衡,合作无法维持。但在无限重复博弈(或每期有正概率继续的博弈)中,由于不存在确定的"最后一期",参与人须权衡当期偏离的短期收益与未来合作破裂的长期损失。无名氏定理指出:若参与人足够耐心(贴现因子充分接近 ),任何优于一次性纳什均衡的可行且个体理性的收益组合均可通过适当策略(如"冷酷触发策略":一旦有人背叛,对方永久转入纳什均衡)作为SPNE实现。这为理解现实中的默契合谋、长期合作关系和声誉机制提供了理论基础。
不完美信息与精炼贝叶斯均衡
当博弈存在不完美信息时,逆向归纳法失效,因为参与人在多节点信息集中无法判断博弈的确切位置。此时需引入更复杂的解概念:精炼贝叶斯均衡(Perfect Bayesian Equilibrium, PBE)。PBE在策略最优之外,要求参与人对自身处于信息集中各节点的可能性持有主观信念(Beliefs)——即一个概率分布,且这些信念必须依据贝叶斯法则和均衡策略进行理性更新。PBE因而将策略优化与信念一致性融为一体,为分析信号传递、信息甄别等存在私人信息的不完美信息动态博弈提供了核心工具。