ARTICLE
触发策略
触发策略 (Trigger Strategy) 触发策略(Trigger Strategy)是重复博弈理论中的核心概念,指参与人在博弈的每一期采取某种合作行动,但一旦观测到对手发生偏离,便永久或在一段时期内切换至惩罚行动的策略规则。触发策略的本质在于利用对未来互动的预期来约束当前行为:当期背叛带来的短期收益必须与触发惩罚所损失的未来合作收益相权衡。这一逻辑构
触发策略 (Trigger Strategy)
触发策略(Trigger Strategy)是重复博弈理论中的核心概念,指参与人在博弈的每一期采取某种合作行动,但一旦观测到对手发生偏离,便永久或在一段时期内切换至惩罚行动的策略规则。触发策略的本质在于利用对未来互动的预期来约束当前行为:当期背叛带来的短期收益必须与触发惩罚所损失的未来合作收益相权衡。这一逻辑构成了博弈论中解释"非合作前提下的合作何以可能"的基石,广泛渗透于产业组织理论、国际经济学、宏观货币政策与政治经济学等领域。
触发策略的经典形式包括严厉触发策略(Grim Trigger Strategy)与针锋相对策略(Tit-for-Tat)。前者由Friedman(1971)系统引入经济学分析:参与人在任何一期若观测到对手偏离合作路径,则从下一期开始永久转向非合作行动(如静态纳什均衡),再无恢复可能。后者由Axelrod(1984)在其著名的重复囚徒困境锦标赛中验证为最具鲁棒性的策略:以合作开始,此后每一期简单复制对手上一期的行动——合作对合作,背叛对背叛。严厉触发策略的惩罚具有不可逆性,因而威慑力最强;针锋相对策略的惩罚力度更温和且允许宽恕,在存在观测误差或信号噪音的环境中更稳健。
无限重复博弈中的均衡条件
考虑标准的无限重复囚徒困境:两个参与人每期同时选择合作(C)或背叛(D)。单期支付矩阵为:双方合作各得 ,双方背叛各得 ,单方背叛者得 (诱惑收益),被背叛者得 ,且满足 与 。设贴现因子为 。若两个参与人均采用严厉触发策略,则合作的激励相容条件为合作的永久现值不低于一次背叛加此后永久惩罚的现值:
整理得临界贴现因子:
当 足够大(即参与人具有充分耐心、重视未来收益)时,合作可以被触发策略支撑为子博弈完美均衡(Subgame Perfect Equilibrium, SPE)。这一结果由无名氏定理(Folk Theorem)一般化:在无限重复博弈中,只要贴现因子充分接近1,任何满足个体理性的可行支付向量均可作为某个子博弈完美均衡的结果出现。触发策略恰是构造此类均衡的最简洁工具。
子博弈完美性的检验要求考察偏离发生后惩罚阶段的可信度。对于严厉触发策略,惩罚阶段双方均采纳单期纳什均衡行为,该行为本身构成一个纳什均衡,因此惩罚威胁是可信的。但在有限重复博弈中,逆向归纳逻辑会瓦解触发策略的威慑力:最后一期合作没有未来,参与者必然背叛;倒数第二期亦然,依此类推,合作在每一期崩溃——此即连锁店悖论(Chainstore Paradox, Selten 1978)所揭示的逻辑。
经济应用:合谋、信誉与政策可信性
触发策略在产业组织理论中为默契合谋(Tacit Collusion)提供了博弈论基础。寡头企业间的价格合谋可建模为重复伯川德(Bertrand)博弈:每家企业当前定价为垄断价格并均分利润,一旦某家企业暗中降价抢市场份额,所有企业将永久恢复边际成本定价(零利润),触发惩罚。贴现因子越高(行业稳定性越强、信息滞后越短),合谋越容易维持。这一框架解释了集中度高、进入壁垒强的行业中价格刚性及平行定价的经验现象。
在国际贸易领域,触发策略刻画了贸易协定与关税合作的执行机制。两国可达成互减关税的合作均衡:若一国单方面提高关税获取贸易条件改善的短期收益,对方则触发惩罚——将关税永久提升至纳什关税水平。世界贸易组织(WTO)争端解决机制可被解读为对触发策略的制度化替代:以有限时间的报复授权替代无限惩罚,降低贸易战螺旋升级的风险。
在宏观货币政策中,Barro--Gordon(1983)模型的不兑现货币政策可借助触发策略分析可信性:中央银行承诺低通胀规则,若某期为刺激产出而制造意外通胀(利用短期菲利普斯曲线的产出—通胀替代),公众的预期形成规则触发惩罚——未来预期通胀上升,央行面临更不利的产出—通胀权衡。重复博弈中,央行在信誉损失与当期刺激收益间的取合同样由贴现因子决定:重视长期信誉的央行(高 )可以维持低通胀均衡,短视的央行(低 )则落入通胀偏误(Inflation Bias)陷阱。这一逻辑为中央银行独立性制度的理论辩护提供了微观基础。
扩展与局限
实际应用中,触发策略面临若干挑战:观测不完美(信号噪音可能导致误触发惩罚)、多市场接触(企业在多个市场同时竞争,触发惩罚的代价在跨市场层面放大了威慑力,但也增加了误判的连带损失)、以及不对称信息下最优惩罚强度的设计问题。机制设计文献发展了"胡萝卜加大棒"(Stick-and-Carrot)类型的折中策略:惩罚阶段并非永久持续,在经历足够长度的惩罚后恢复合作,从而在维持激励的同时保留了合作剩余。Green与Porter(1984)的寡头模型以随机需求为前提,证明了价格战(惩罚阶段)可能是均衡路径上对不可观测需求冲击的最优反应,合理化了现实中寡头行业周期性价格战与合谋阶段交替出现的现象。触发策略作为分析重复互动中信誉、承诺与惩罚机制的元理论框架,始终处于博弈论与经济理论交汇的前沿。