ARTICLE

反应方程

反应方程 (Reaction Function) 反应方程 (Reaction Function),亦称 反应函数 或 最优反应函数 (Best Response Function),是 博弈论 与 产业组织理论 中的核心概念,描述一个决策主体在给定其他参与者策略的前提下,如何选择自身的 最优策略。反应方程将策略性相互依赖关系以函数形式精确刻画,是求解 纳什

浏览 0 更新 2025-10-26

反应方程 (Reaction Function)

反应方程 (Reaction Function),亦称 反应函数最优反应函数 (Best Response Function),是 博弈论产业组织理论 中的核心概念,描述一个决策主体在给定其他参与者策略的前提下,如何选择自身的 最优策略。反应方程将策略性相互依赖关系以函数形式精确刻画,是求解 纳什均衡 的基本工具。该概念最早由法国经济学家 古诺 在其1838年的双寡头模型中隐性引入,后经 纳什 等人的工作得到一般化推广。

数学定义

在一个 nn 人策略式博弈中,参与者 ii 的策略空间为 SiS_i,支付函数为 ui(si,si)u_i(s_i, s_{-i}),其中 sis_{-i} 表示除 ii 外所有其他参与者的策略组合。参与者 ii 的反应方程 RiR_i 定义为:

Ri(si)=argmaxsiSiui(si,si)R_i(s_{-i}) = \arg\max_{s_i \in S_i} u_i(s_i, s_{-i})

即给定对手策略 sis_{-i} 时,使 ii 的支付最大化的策略集合。若 RiR_i 对所有 sis_{-i} 都是单值函数,则反应方程可直接写为 si=Ri(si)s_i = R_i(s_{-i})。纳什均衡 s=(s1,,sn)s^* = (s_1^*, \ldots, s_n^*) 满足所有参与者的策略同时为其对他人策略的最优反应:

si=Ri(si),is_i^* = R_i(s_{-i}^*), \quad \forall i

即均衡位于所有反应方程的交点。

古诺模型中的反应方程

古诺双寡头模型 中,两家企业同时选择产量 q1,q2q_1, q_2,面对线性反需求函数 P=ab(q1+q2)P = a - b(q_1 + q_2) 且边际成本恒为 cc。企业 1 的利润最大化问题为:

maxq1π1=(ab(q1+q2))q1cq1\max_{q_1} \, \pi_1 = (a - b(q_1 + q_2))q_1 - c q_1

一阶条件给出企业 1 的 古诺反应方程

q1=R1(q2)=ac2bq22q_1 = R_1(q_2) = \frac{a - c}{2b} - \frac{q_2}{2}

对称地,企业 2 的反应方程为 q2=R2(q1)=ac2bq12q_2 = R_2(q_1) = \frac{a - c}{2b} - \frac{q_1}{2}。两条反应曲线向下倾斜:对手产量越高,自身最优产量越低,体现了 策略替代 (Strategic Substitutes) 的性质。联立求解即得古诺-纳什均衡。

反应方程的斜率与策略性质

反应方程的斜率揭示了博弈的策略本质。若反应方程斜率为负——如古诺产量竞争中 dR1dq2=12<0\frac{d R_1}{d q_2} = -\frac{1}{2} < 0——则称策略为 策略替代:对手更激进的行动使自身的最优反应更为保守。若反应方程斜率为正——如 伯特兰模型 中价格竞争的反应曲线向上倾斜——则称策略为 策略互补 (Strategic Complements):对手提价使自身提价也更有吸引力。这一区分由 BulowGeanakoplosKlemperer 于1985年系统阐述,对理解市场结构与竞争政策具有深远影响。

反应方程与均衡稳定性

反应方程不仅用于求解均衡,还提供了分析均衡稳定性的框架。在古诺动态调整过程中,若企业按 q1t+1=R1(q2t)q_1^{t+1} = R_1(q_2^t) 迭代更新产量,则均衡稳定的充要条件为反应方程斜率的绝对值小于 1——即反应曲线在均衡点处比 4545^\circ 线更平坦。这一条件保证了逐次调整最终收敛于纳什均衡,而非发散或陷入循环。

应用与扩展

反应方程广泛应用于 拍卖理论(投标者对竞争对手出价策略的最优反应)、货币政策博弈(中央银行对通胀预期的反应函数,即 泰勒规则 的理论前身)以及 国际贸易 中的关税博弈。在实证产业组织中,反应方程的估计是识别企业竞争行为(产量竞争还是价格竞争)的关键方法:若估计出的反应方程斜率为负,则支持产量竞争假设;若为正,则支持价格竞争假设。