ARTICLE

斯塔克伯格模型

斯塔克伯格模型 (Stackelberg Model) 斯塔克伯格模型(Stackelberg Model)是产业组织理论中分析寡头企业序贯决策的核心框架,由德国经济学家Heinrich von Stackelberg于1934年在《市场形式与均衡》(Marktform und Gleichgewicht)中首次提出。与古诺模型中企业同时选择产量的假设不同,

浏览 0 更新 2025-12-06

斯塔克伯格模型 (Stackelberg Model)

斯塔克伯格模型(Stackelberg Model)是产业组织理论中分析寡头企业序贯决策的核心框架,由德国经济学家Heinrich von Stackelberg于1934年在《市场形式与均衡》(Marktform und Gleichgewicht)中首次提出。与古诺模型中企业同时选择产量的假设不同,斯塔克伯格模型引入了决策时序的不对称性:市场中存在一家领导者(Leader)和一家跟随者(Follower),领导者先行动并不可逆地承诺其产量,跟随者观察到领导者的选择后再决定自身产量。这一时序结构产生了先动优势(First-Mover Advantage),是理解市场中的战略承诺、进入威慑和层级竞争等议题的理论基石。

模型设定与假设

模型的基本设定与古诺双寡头框架一致,核心差异在于决策顺序。假设市场中有两家生产同质产品的企业。反需求函数为线性形式 P=abQP = a - bQ,其中 Q=qL+qFQ = q_L + q_FqLq_L 为领导者产量,qFq_F 为跟随者产量)。两家企业具有相同的恒定边际成本 cc(且 a>c0a > c \geq 0),无固定成本。信息是完全且完美的:跟随者能够准确观测到领导者的产量,领导者也知晓跟随者将进行最优化反应。这一博弈为两阶段完全信息动态博弈,适用子博弈精炼纳什均衡(Subgame Perfect Nash Equilibrium, SPNE),求解方法为反向归纳法(Backward Induction)。

模型求解:反向归纳法

第二阶段——跟随者的最优反应。给定领导者已选择的产量 qLq_L,跟随者面临剩余需求 P=ab(qL+qF)P = a - b(q_L + q_F),其利润函数为:

πF=(ab(qL+qF))qFcqF\pi_F = (a - b(q_L + q_F))q_F - c q_F

qFq_F 求一阶条件:

πFqF=abqL2bqFc=0\frac{\partial \pi_F}{\partial q_F} = a - b q_L - 2b q_F - c = 0

解得跟随者的反应函数

qF(qL)=ac2bqL2q_F(q_L) = \frac{a - c}{2b} - \frac{q_L}{2}

该反应函数与古诺模型中企业的反应函数形式一致:跟随者将领导者产量视为给定,以最优方式回应。

第一阶段——领导者的利润最大化。领导者预见到跟随者将按上述反应函数行动,将其嵌入自身利润函数:

πL=[ab(qL+ac2bqL2)]qLcqL\pi_L = \left[a - b\left(q_L + \frac{a - c}{2b} - \frac{q_L}{2}\right)\right]q_L - c q_L

化简括号内表达式:

Q=qL+ac2bqL2=ac2b+qL2Q = q_L + \frac{a - c}{2b} - \frac{q_L}{2} = \frac{a - c}{2b} + \frac{q_L}{2}
P=ab(ac2b+qL2)=a+c2bqL2P = a - b\left(\frac{a - c}{2b} + \frac{q_L}{2}\right) = \frac{a + c}{2} - \frac{b q_L}{2}

领导者利润函数为:

πL=(a+c2bqL2c)qL=(ac2bqL2)qL\pi_L = \left(\frac{a + c}{2} - \frac{b q_L}{2} - c\right)q_L = \left(\frac{a - c}{2} - \frac{b q_L}{2}\right)q_L

qLq_L 求导得:

πLqL=ac2bqL=0qL=ac2b\frac{\partial \pi_L}{\partial q_L} = \frac{a - c}{2} - b q_L = 0 \quad \Rightarrow \quad q_L^* = \frac{a - c}{2b}

代入跟随者反应函数:

qF=ac2b12ac2b=ac4bq_F^* = \frac{a - c}{2b} - \frac{1}{2} \cdot \frac{a - c}{2b} = \frac{a - c}{4b}

均衡总产量与均衡价格:

Q=qL+qF=3(ac)4b,P=a+3c4Q^* = q_L^* + q_F^* = \frac{3(a - c)}{4b}, \quad P^* = \frac{a + 3c}{4}

与古诺均衡的系统比较

将斯塔克伯格均衡与古诺均衡(qC=ac3bq_C = \frac{a - c}{3b} 每家)并列比较,可清晰揭示序贯决策的经济后果:

  • 领导者产量: qL=ac2b>qC=ac3bq_L^* = \frac{a-c}{2b} > q_C = \frac{a-c}{3b},领导者产量高于古诺水平。
  • 跟随者产量: qF=ac4b<qC=ac3bq_F^* = \frac{a-c}{4b} < q_C = \frac{a-c}{3b},跟随者产量低于古诺水平。
  • 总产量: QS=3(ac)4b>QC=2(ac)3bQ_S^* = \frac{3(a-c)}{4b} > Q_C = \frac{2(a-c)}{3b},斯塔克伯格总产量更高。
  • 市场价格: PS=a+3c4<PC=a+2c3P_S^* = \frac{a+3c}{4} < P_C = \frac{a+2c}{3},斯塔克伯格价格更低。
  • 领导者利润: πL=(ac)28b>πC=(ac)29b\pi_L^* = \frac{(a-c)^2}{8b} > \pi_C = \frac{(a-c)^2}{9b},领导者获得高于古诺的利润。
  • 跟随者利润: πF=(ac)216b<πC\pi_F^* = \frac{(a-c)^2}{16b} < \pi_C,跟随者利润低于古诺水平。

领导者利润高于古诺、跟随者利润低于古诺,这体现了先动优势的本质:领导者通过提前承诺一个激进的产量来战略性引导跟随者的行为,使其被迫收缩产量,从而攫取更大市场份额和利润。同时,消费者因总产量增加和价格下降而受益。

先动优势的机制与条件

先动优势并非必然成立,其有效性依赖于承诺的可信性(Credibility of Commitment)。领导者的产量决策必须不可逆——例如通过建造大型工厂、签订长期合同或进行不可收回的资本投资来形成沉没成本,使跟随者确信领导者不会事后调整产量。若缺乏可信承诺,博弈退化为同时行动的古诺均衡。

此外,先动优势的方向取决于策略变量的性质。若企业竞争的是价格而非产量(即斯塔克伯格价格博弈),则后动者反而具有优势:跟随者可以观察领导者定价后选择略微更低的价格,从而夺取全部市场。因此在价格竞争中,后动优势(Second-Mover Advantage)替代了先动优势。这一对称性由策略替代策略互补的框架所统一:产量竞争中的策略替代使得领导者激进扩张有利可图,而价格竞争中的策略互补使得领导者收敛定价反而对跟随者有利。

拓展与应用

斯塔克伯格模型在多个领域有重要应用。在产业组织中,该模型用于分析在位企业通过产能扩张阻止潜在进入者的进入威慑策略——在位者作为领导者承诺大规模产能,使进入者的预期利润不足以覆盖进入成本,典型的分析框架即迪克西特-斯彭斯模型(Dixit-Spence Model)。在国际贸易中,该模型被用于分析出口补贴的战略性贸易政策:政府通过补贴本国企业使其在国际市场上占据斯塔克伯格领导者地位,将利润从外国企业转移至本国。在供应链管理中,制造商与零售商之间的博弈常被建模为斯塔克伯格结构,制造商作为领导者设定批发价格,零售商作为跟随者决定订货量或零售价格。此外,多个领导者与多个跟随者并存的情形由多斯塔克伯格博弈刻画,当决策时序内生于企业选择时,博弈演化为内生时序博弈(Endogenous Timing Game),企业自主选择成为领导者或跟随者。

经济学意义与局限性

斯塔克伯格模型的核心洞见在于:在寡头市场中,时序本身就是一种战略资源。通过抢先承诺不可逆的行动,企业可以塑造竞争对手的预期和反应,从而获取超越同时博弈均衡的超额利润。这一思想深刻影响了现代战略管理理论,特别是关于先发优势、战略承诺和竞争性战略互动的分析范式。然而,该模型也存在若干局限性:第一,线性需求和恒定边际成本的设定简化了现实市场的复杂需求结构;第二,模型隐含假设跟随者被动接受领导者产量,而在现实中跟随者可能采取非价格手段(如产品差异化、广告投入)予以回击;第三,信息不对称的存在——若跟随者对领导者的成本结构存在不完全信息,均衡性质将发生显著改变。尽管如此,斯塔克伯格模型作为序贯博弈在经济学中最早的形式化应用之一,至今仍是分析具有层级结构的市场竞争的基准框架。