对偶变量 (Dual Variable)
对偶变量是在数学规划和最优化理论中,通过构造拉格朗日函数引入的、与约束条件一一对应的辅助变量。它是原始约束的影子价格(Shadow Price),度量了约束资源对目标函数最优值的边际贡献。对偶变量是沟通原始问题与对偶问题的桥梁,也是KKT条件和互补松弛条件的核心组成部分。
定义与构造
考虑一般形式的约束优化问题(原始问题):
xminf(x)s.t.gi(x)≤0,i=1,…,m
构造拉格朗日函数:
L(x,λ)=f(x)+i=1∑mλigi(x)
其中 λi≥0 即为与第 i 个不等式约束 gi(x)≤0 对应的对偶变量(亦称拉格朗日乘子)。若存在等式约束 hj(x)=0,则对应的对偶变量 μj 符号不受限制。
影子价格的经济解释
对偶变量的核心经济含义是影子价格:λi 表示第 i 个约束的右端项放宽一个单位时,目标函数最优值的边际改善量。形式上,设最优值函数为:
V(b)=xmin{f(x)∣gi(x)≤bi}
由包络定理,在最优解处有:
∂bi∂V=λi∗
即最优对偶变量等于最优值函数关于对应约束资源的偏导数。若 λi∗ 很大,说明该资源极度稀缺,放宽约束将带来显著收益;若 λi∗=0,则该资源有剩余,约束非紧。
这一思想在经济学中广泛应用:消费者理论中,预算约束的拉格朗日乘子等于货币的边际效用;成本最小化问题中,产出约束的对偶变量等于边际成本;线性规划中,对偶变量直接给出各类资源的影子价格。
对偶变量与 KKT 条件
KKT条件(Karush-Kuhn-Tucker 条件)是一阶必要条件,对偶变量在其中扮演关键角色:
- Stationarity:∇f(x∗)+∑i=1mλi∗∇gi(x∗)=0
- Primal Feasibility:gi(x∗)≤0
- Dual Feasibility:λi∗≥0
- Complementary Slackness:λi∗gi(x∗)=0
其中互补松弛条件直接连接对偶变量与约束:若约束非紧(gi(x∗)<0),则 λi∗=0;若对偶变量严格为正(λi∗>0),则约束必为紧约束(gi(x∗)=0)。这种"一紧一松"的互补关系使得对偶变量能够指示哪些约束是真正的瓶颈。
线性规划中的对偶变量
在标准形式的线性规划中,原始问题与对偶问题中的对偶变量关系最为清晰:
原始问题:
mincTxs.t.Ax≥b,x≥0
对偶问题:
maxbTys.t.ATy≤c,y≥0
这里的 y∈Rm 就是对偶变量向量。由强对偶定理,最优时 cTx∗=bTy∗。每个 yi 衡量了第 i 个资源约束的边际价值。在生产经营的语境下,yi 可解读为企业愿意为额外一单位资源 bi 支付的最高价格。
拉格朗日对偶中的对偶变量
对于一般的非线性规划,定义拉格朗日对偶函数:
θ(λ)=xinfL(x,λ)
对偶函数是对偶变量的函数,给出了原始最优值的一个下界(弱对偶性:θ(λ)≤f(x∗) 对所有 λ≥0 成立)。对偶问题 maxλ≥0θ(λ) 旨在寻找最紧的下界。当Slater条件等约束品性成立且问题为凸时,强对偶性保证对偶间隙为零,此时最优对偶变量可通过求解对偶问题获得。
与包络定理的联系
对偶变量的边际解释由包络定理严格保证。考虑带参数的优化问题:
V(α)=xminf(x,α)s.t.gi(x,α)≤0
在最优解处,V 关于参数 αk 的偏导数为拉格朗日函数关于 αk 的偏导数在最优点的取值:
∂αk∂V=∂αk∂L(x∗,λ∗)
当参数 αk 恰好是约束的右端项时,该偏导数简化为对应的对偶变量 λk∗。包络定理因此为对偶变量的"边际价值"解释提供了严格的数学基础。
小结
对偶变量不是求解优化问题的副产品,而是理解问题经济结构的核心信息载体。它将物理约束转化为价格信号,揭示稀缺资源的影子价值。从线性规划的影子价格,到消费者理论的边际效用,再到机制设计中的信息租金,对偶变量的思想贯穿经济分析与优化理论始终。