# 斯塔克伯格与分段函数 (Stackelberg with Piecewise Function)
在{{{产业组织理论}}}和{{{微观经济学}}}中,对{{{寡头垄断}}}市场的分析是核心内容之一。其中,{{{Stackelberg模型}}}描述了一种{{{双头垄断}}}(Duopoly)市场中的{{{序贯博弈}}}(Sequential Game)。该模型的标准形式假设企业的{{{反应函数}}}是线性的或至少是连续可微的简单函数。然而,在更贴近现实的场景中,企业的决策常常受到{{{产能约束}}}、分段的{{{成本函数}}}或其他非线性因素的影响,导致其反应函数呈现为{{{分段函数}}} (Piecewise Function) 的形式。本词条旨在阐述当跟随者(Follower)的反应函数为分段函数时,领导者(Leader)如何进行其最优决策。
标准的{{{Stackelberg模型}}}假设如下: 1. 市场中有两个企业,一个是领导者(Firm 1),另一个是跟随者(Firm 2)。 2. 这是一个两阶段的序贯博弈:领导者首先决定并公布其产量 $q_1$。 3. 跟随者在观察到 $q_1$ 后,再决定其最优产量 $q_2$ 以实现自身{{{利润最大化}}}。 4. 两个企业都了解市场的需求结构和彼此的成本函数。
解决该模型的标准方法是{{{逆向归纳法}}} (Backward Induction)。首先,求解跟随者的{{{最优反应函数}}} $R_2(q_1)$,该函数表示对于任意给定的 $q_1$,跟随者的最优产量 $q_2$ 是多少。然后,领导者(由于其“先行者优势”)能够预见到跟随者的反应,因此它将 $R_2(q_1)$ 代入自己的利润函数中,通过选择 $q_1$ 来最大化其利润。
当反应函数 $R_2(q_1)$ 是一个简单的连续函数时,这个代入和求导的过程是直接的。但当 $R_2(q_1)$ 是一个分段函数时,领导者的决策过程变得更加复杂和具有策略性。
## 分段反应函数的成因
跟随者的反应函数之所以会呈现分段形式,通常源于其生产或成本结构中的“拐点”或“不连续性”。
1. {{{产能约束}}} (Capacity Constraint):这是最常见的情形。假设跟随者(Firm 2)的最大产能为 $K_2$,即其产量 $q_2$ 不能超过 $K_2$。在求解自身利润最大化时,它会先计算出无约束下的最优产量 $q_2^*$。 * 如果 $q_2^* \le K_2$,那么产能约束是无效的(non-binding),它将生产 $q_2^*$。 * 如果 $q_2^* > K_2$,产能约束是有效的(binding),它只能生产其最大产能 $K_2$。 这导致其反应函数在某个点上发生改变,形成一个分段函数。
2. 分段的{{{边际成本}}}函数 (Piecewise Marginal Cost Function):假设跟随者在产量低于某个阈值 $\bar{q}$ 时,{{{边际成本}}}为 $c_L$;当产量超过 $\bar{q}$ 时(例如需要支付加班工资或启用备用设备),边际成本上升到 $c_H$。这种成本结构的变化会导致其利润最大化条件($MR=MC$)在不同产量区间有不同的解,从而形成分段的反应函数。
## 领导者的决策过程:一个基于产能约束的例子
为了清晰地说明领导者的决策,我们使用一个具体的例子。假设市场逆需求函数为 $P = a - b(q_1 + q_2)$,两家企业的边际成本均为常数 $c$。特别地,我们假设跟随者(Firm 2)面临产能约束 $q_2 \le K$。
#### 第一步:求解跟随者的分段反应函数
对于给定的领导者产量 $q_1$,跟随者面临的{{{剩余需求曲线}}} (Residual Demand Curve) 为 $P = (a - bq_1) - bq_2$。其边际收益为 $MR_2 = (a - bq_1) - 2bq_2$。
根据利润最大化原则 $MR_2=c$,我们可以解出其在无约束情况下的最优反应: $$ (a - bq_1) - 2bq_2 = c $$ $$ q_2^*(q_1) = \frac{a-c}{2b} - \frac{1}{2}q_1 $$ 这是标准的{{{库尔诺竞争}}} (Cournot competition) 中的反应函数。
现在,我们引入产能约束 $q_2 \le K$。跟随者的实际最优反应 $R_2(q_1)$ 变为: $$ R_2(q_1) = \min\left( \frac{a-c}{2b} - \frac{1}{2}q_1, K \right) $$ 这是一个分段函数。我们可以通过求解 $ \frac{a-c}{2b} - \frac{1}{2}q_1 = K $ 来找到反应函数的“拐点”。解得: $$ q_1' = \frac{a-c}{b} - 2K $$ 这个 $q_1'$ 是一个临界值。 * 当领导者产量 $q_1 < q_1'$ 时,跟随者的无约束最优反应会超过其产能 $K$,因此它只能生产 $K$。 * 当领导者产量 $q_1 \ge q_1'$ 时,跟随者的无约束最优反应未达到产能上限,因此它将按照其标准反应函数进行生产。
因此,跟随者的分段反应函数可以明确写为: $$ R_2(q_1) = \begin{cases} K & \text{if } q_1 < \frac{a-c}{b} - 2K \\ \frac{a-c}{2b} - \frac{1}{2}q_1 & \text{if } q_1 \ge \frac{a-c}{b} - 2K \end{cases} $$
#### 第二步:领导者在不同“情景”下评估利润
领导者是一个理性的决策者,它完全了解跟随者的上述分段反应。因此,它需要比较两种策略带来的利润:
策略A:诱导跟随者进行标准反应 这种策略下,领导者假定其产量 $q_1$ 将会落在 $q_1 \ge q_1'$ 的区间内。因此,它将 $q_2 = \frac{a-c}{2b} - \frac{1}{2}q_1$代入自己的利润函数 $\Pi_1$: $$ \Pi_1(q_1) = P \cdot q_1 - c \cdot q_1 = [a - b(q_1 + q_2)]q_1 - cq_1 $$ $$ \Pi_1(q_1) = \left[a - b\left(q_1 + \left(\frac{a-c}{2b} - \frac{1}{2}q_1\right)\right)\right]q_1 - cq_1 $$ 简化后得到: $$ \Pi_1(q_1) = \left(\frac{a-c}{2} - \frac{b}{2}q_1\right)q_1 $$ 通过对 $q_1$ 求一阶导数并令其为零,我们得到标准的斯塔克伯格领导者产量: $$ q_1^S = \frac{a-c}{2b} $$ 此时,领导者获得利润 $\Pi_1^S$。
策略B:诱导跟随者达到产能上限 这种策略下,领导者有意将自己的产量 $q_1$设定在 $q_1 < q_1'$ 区间,从而迫使跟随者只能生产 $q_2 = K$。此时,领导者视跟随者的产量为一个固定的外生变量 $K$。它的利润函数变为: $$ \Pi_1(q_1) = [a - b(q_1 + K)]q_1 - cq_1 = [(a-c-bK) - bq_1]q_1 $$ 这是一个关于 $q_1$ 的简单二次函数。最大化该利润函数,我们得到在此情景下的最优产量: $$ q_1^K = \frac{a-c-bK}{2b} $$ 此时,领导者获得利润 $\Pi_1^K$。
#### 第三步:一致性检验与最终决策
领导者的决策不能纸上谈兵,每种策略的最优解必须与其初始假设相符。
1. 检验策略A:计算出的 $q_1^S = \frac{a-c}{2b}$ 是否满足其假设条件 $q_1 \ge q_1' = \frac{a-c}{b} - 2K$? * 如果满足,那么 $(q_1^S, \Pi_1^S)$ 是一个有效的候选结果。 * 如果不满足,意味着标准的斯塔克伯格产量是不可行的,因为一旦领导者生产 $q_1^S$,跟随者的最优反应实际上是 $K$,而不是标准反应函数给出的值。此时,策略A失败。
2. 检验策略B:计算出的 $q_1^K = \frac{a-c-bK}{2b}$ 是否满足其假设条件 $q_1 < q_1' = \frac{a-c}{b} - 2K$? * 如果满足,那么 $(q_1^K, \Pi_1^K)$ 是一个有效的候选结果。 * 如果不满足,意味着领导者在“跟随者被约束”的假设下得到的最优产量,实际上并不能导致跟随者被约束。在这种情况下,领导者要想迫使跟随者生产 $K$,它能选择的、使其利润最大的产量就是尽可能接近 $q_1'$ 的值,即 $q_1 = q_1' - \epsilon$($\epsilon$ 为一极小正数)。此时需要计算在 $q_1 \approx q_1'$ 时的利润。
最后,领导者将比较所有有效候选结果的利润值($\Pi_1^S$ vs $\Pi_1^K$ 或其他边界点的利润),选择能为自己带来最高利润的策略,并执行相应的产量决策。
## 经济学直觉与策略含义
这个看似复杂的计算过程背后,蕴含着深刻的经济学直觉。
跟随者的产能约束从一个侧面限制了其竞争能力。对于领导者而言,这既是信息,也是可以利用的工具。在某些情况下,领导者可能会发现,与其生产很高的产量(如标准斯塔克伯格解)来大幅压缩跟随者的市场空间,不如采取一种“策略性迁就”(Strategic Accommodation)。
具体来说,领导者可能选择一个比 $q_1^S$ 更低的产量,故意让跟随者扩大生产直至其产能上限 $K$。这样做虽然看似“让出”了部分市场,但好处在于将竞争对手的产量“固定”在了一个可预测的水平 $K$。一旦跟随者的产量被锁定,领导者就如同在面对一个需求为 $P = (a-bK) - bq_1$ 的垄断市场,可以更从容地选择自己的最优产量。如果产能 $K$ 足够小,这种策略为领导者带来的利润可能超过标准斯塔克伯格模型下的利润。
因此,当跟随者的反应函数是分段时,领导者的决策不再是单一的数学优化,而是一种在不同博弈“剧本”之间进行权衡的策略选择。它体现了{{{博弈论}}}中一个核心思想:通过影响对手的决策集或最优反应,来塑造对自己有利的博弈格局。这一分析框架同样适用于分析关税、配额等政策对寡头市场竞争的影响。