ARTICLE

马尔可夫完美均衡

马尔可夫完美均衡 (Markov Perfect Equilibrium) 马尔可夫完美均衡（Markov Perfect Equilibrium, MPE）是动态博弈与随机博弈理论中的核心解概念，由 Maskin 和 Tirole（1988, 2001）在动态寡头竞争的系列论文中正式提出并加以系统发展。MPE 是子博弈完美纳什均衡（SPNE）在状态依赖环境

浏览 3 更新 2025-10-26

马尔可夫完美均衡 (Markov Perfect Equilibrium)

马尔可夫完美均衡（Markov Perfect Equilibrium, MPE）是动态博弈与随机博弈理论中的核心解概念，由 Maskin 和 Tirole（1988, 2001）在动态寡头竞争的系列论文中正式提出并加以系统发展。MPE 是子博弈完美纳什均衡（SPNE）在状态依赖环境下的精炼：参与者的策略仅依赖于与当期收益直接相关的"收益相关状态"（payoff-relevant state），而不依赖于博弈的完整历史或非收益相关的过往信息。这一限制排除了一类依赖触发策略的惩罚性均衡——尤其是无名氏定理在无限重复博弈中产生的大量多重均衡——从而在无数 SPNE 中筛选出紧贴当期经济基本面、具有 Markov 递归结构的策略组合。

形式定义与递归结构

考虑一个 n 人离散时间无限期随机博弈。记状态变量为 $s \in S$ ，概括所有直接影响参与者当期收益函数和可行行动集的信息。在状态 s 下，参与者 i 选择行动 $a_i \in A_i(s)$ ，组合行动为 $a = (a_1, \dots, a_n)$ ，当期收益为 $u_i(s, a)$ 。状态转移服从一阶马尔可夫过程：下一期状态 $s'$ 的概率分布仅取决于当期状态 s 和当期行动组合 a，即 $P(s' \mid s, a)$ 。

策略 $\sigma_i$ 是从博弈历史到行动分布的映射。若 $\sigma_i$ 仅依赖于当期状态 s，而与 s 之前的历史无关，即 $\sigma_i: S \to \Delta(A_i)$ ，则称其具有 马尔可夫性质。若对所有参与者 i 和所有状态 s，策略组合 $\sigma = (\sigma_1, \dots, \sigma_n)$ 均为从该状态出发的子博弈的纳什均衡，则称 $\sigma$ 为 马尔可夫完美均衡。

MPE 的价值函数 $V_i(s)$ 和策略函数通过以下贝尔曼方程联立刻画：

V_i(s) = \max_{a_i \in A_i(s)} \left\{ u_i(s, a_i, \sigma_{-i}(s)) + \beta \sum_{s' \in S} V_i(s') \, P(s' \mid s, a_i, \sigma_{-i}(s)) \right\}

其中 $\beta \in (0,1)$ 为贴现因子。该递归结构是 MPE 可计算性的核心：当期最优行动不仅影响即期收益，还通过状态转移影响未来博弈的起点，而这一切仅需追踪 S 上的价值与策略，历史信息的维度被完全剥离。

经济学应用与均衡精炼

MPE 在多个经济学领域获得了广泛应用。在产业组织理论中，Ericson 和 Pakes（1995）以 MPE 为均衡框架建立产业动态模型，分析企业进入、退出与投资决策在异质性生产率状态下的动态均衡；Bajari、Benkard 和 Levin（2007）进一步开发了 MPE 的两阶段结构估计方法，使得动态寡头博弈的经验研究成为可能。在宏观经济学中，Krusell 和 Smith（1998）的异质性代理人模型在总生产率与个体财富的联合状态空间上寻求 MPE，刻画不完全市场下的财富分布动态。在政治经济学中，Acemoglu 和 Robinson（2001）利用 MPE 分析民主化进程中的精英-市民动态博弈，状态变量为政体类型和革命威胁强度。

MPE 的主要理论优势在于精炼力度：将策略空间从完整历史压缩到状态变量，大幅减少了 SPNE 的多重性，对结构估计和反事实模拟至关重要。然而其局限性也显而易见——当某些历史变量虽不影响当期收益却能传递关键协调信号时（如声誉形成），MPE 可能排除经济意义上合理的均衡。在连续状态空间中，MPE 的存在性与唯一性通常需要借助不动点定理和压缩映射来证明，条件比离散情形更为严苛。近年来，Weintraub、Benkard 和 Van Roy（2008）提出的 oblivious equilibrium 在大规模参与者极限下进一步简化了均衡计算，构成了 MPE 在计算层面的重要拓展。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。