ARTICLE
马尔可夫完美均衡
马尔可夫完美均衡 (Markov Perfect Equilibrium) 马尔可夫完美均衡(Markov Perfect Equilibrium, MPE)是动态博弈与随机博弈理论中的核心解概念,由 Maskin 和 Tirole(1988, 2001)在动态寡头竞争的系列论文中正式提出并加以系统发展。MPE 是子博弈完美纳什均衡(SPNE)在状态依赖环境
马尔可夫完美均衡 (Markov Perfect Equilibrium)
马尔可夫完美均衡(Markov Perfect Equilibrium, MPE)是动态博弈与随机博弈理论中的核心解概念,由 Maskin 和 Tirole(1988, 2001)在动态寡头竞争的系列论文中正式提出并加以系统发展。MPE 是子博弈完美纳什均衡(SPNE)在状态依赖环境下的精炼:参与者的策略仅依赖于与当期收益直接相关的"收益相关状态"(payoff-relevant state),而不依赖于博弈的完整历史或非收益相关的过往信息。这一限制排除了一类依赖触发策略的惩罚性均衡——尤其是无名氏定理在无限重复博弈中产生的大量多重均衡——从而在无数 SPNE 中筛选出紧贴当期经济基本面、具有 Markov 递归结构的策略组合。
形式定义与递归结构
考虑一个 n 人离散时间无限期随机博弈。记状态变量为 ,概括所有直接影响参与者当期收益函数和可行行动集的信息。在状态 s 下,参与者 i 选择行动 ,组合行动为 ,当期收益为 。状态转移服从一阶马尔可夫过程:下一期状态 的概率分布仅取决于当期状态 s 和当期行动组合 a,即 。
策略 是从博弈历史到行动分布的映射。若 仅依赖于当期状态 s,而与 s 之前的历史无关,即 ,则称其具有 马尔可夫性质。若对所有参与者 i 和所有状态 s,策略组合 均为从该状态出发的子博弈的纳什均衡,则称 为 马尔可夫完美均衡。
MPE 的价值函数 和策略函数通过以下贝尔曼方程联立刻画:
其中 为贴现因子。该递归结构是 MPE 可计算性的核心:当期最优行动不仅影响即期收益,还通过状态转移影响未来博弈的起点,而这一切仅需追踪 S 上的价值与策略,历史信息的维度被完全剥离。
经济学应用与均衡精炼
MPE 在多个经济学领域获得了广泛应用。在产业组织理论中,Ericson 和 Pakes(1995)以 MPE 为均衡框架建立产业动态模型,分析企业进入、退出与投资决策在异质性生产率状态下的动态均衡;Bajari、Benkard 和 Levin(2007)进一步开发了 MPE 的两阶段结构估计方法,使得动态寡头博弈的经验研究成为可能。在宏观经济学中,Krusell 和 Smith(1998)的异质性代理人模型在总生产率与个体财富的联合状态空间上寻求 MPE,刻画不完全市场下的财富分布动态。在政治经济学中,Acemoglu 和 Robinson(2001)利用 MPE 分析民主化进程中的精英-市民动态博弈,状态变量为政体类型和革命威胁强度。
MPE 的主要理论优势在于精炼力度:将策略空间从完整历史压缩到状态变量,大幅减少了 SPNE 的多重性,对结构估计和反事实模拟至关重要。然而其局限性也显而易见——当某些历史变量虽不影响当期收益却能传递关键协调信号时(如声誉形成),MPE 可能排除经济意义上合理的均衡。在连续状态空间中,MPE 的存在性与唯一性通常需要借助不动点定理和压缩映射来证明,条件比离散情形更为严苛。近年来,Weintraub、Benkard 和 Van Roy(2008)提出的 oblivious equilibrium 在大规模参与者极限下进一步简化了均衡计算,构成了 MPE 在计算层面的重要拓展。