ARTICLE

对偶变量

对偶变量 (Dual Variable) 对偶变量是在数学规划和最优化理论中,通过构造拉格朗日函数引入的、与约束条件一一对应的辅助变量。它是原始约束的影子价格(Shadow Price),度量了约束资源对目标函数最优值的边际贡献。对偶变量是沟通原始问题与对偶问题的桥梁,也是KKT条件和互补松弛条件的核心组成部分。 定义与构造 考虑一般形式的约束优化问题(原始

浏览 5 更新 2026-05-25

对偶变量 (Dual Variable)

对偶变量是在数学规划最优化理论中,通过构造拉格朗日函数引入的、与约束条件一一对应的辅助变量。它是原始约束的影子价格(Shadow Price),度量了约束资源对目标函数最优值的边际贡献。对偶变量是沟通原始问题与对偶问题的桥梁,也是KKT条件互补松弛条件的核心组成部分。

定义与构造

考虑一般形式的约束优化问题(原始问题):

minx  f(x)s.t.gi(x)0,  i=1,,m\min_{\mathbf{x}} \; f(\mathbf{x}) \quad \text{s.t.} \quad g_i(\mathbf{x}) \leq 0,\; i = 1,\dots,m

构造拉格朗日函数

L(x,λ)=f(x)+i=1mλigi(x)\mathcal{L}(\mathbf{x}, \boldsymbol{\lambda}) = f(\mathbf{x}) + \sum_{i=1}^{m} \lambda_i g_i(\mathbf{x})

其中 λi0\lambda_i \geq 0 即为与第 ii 个不等式约束 gi(x)0g_i(\mathbf{x}) \leq 0 对应的对偶变量(亦称拉格朗日乘子)。若存在等式约束 hj(x)=0h_j(\mathbf{x}) = 0,则对应的对偶变量 μj\mu_j 符号不受限制。

影子价格的经济解释

对偶变量的核心经济含义是影子价格λi\lambda_i 表示第 ii 个约束的右端项放宽一个单位时,目标函数最优值的边际改善量。形式上,设最优值函数为:

V(b)=minx{f(x)gi(x)bi}V(\mathbf{b}) = \min_{\mathbf{x}} \{ f(\mathbf{x}) \mid g_i(\mathbf{x}) \leq b_i \}

包络定理,在最优解处有:

Vbi=λi\frac{\partial V}{\partial b_i} = \lambda_i^*

即最优对偶变量等于最优值函数关于对应约束资源的偏导数。若 λi\lambda_i^* 很大,说明该资源极度稀缺,放宽约束将带来显著收益;若 λi=0\lambda_i^* = 0,则该资源有剩余,约束非紧。

这一思想在经济学中广泛应用:消费者理论中,预算约束的拉格朗日乘子等于货币的边际效用成本最小化问题中,产出约束的对偶变量等于边际成本线性规划中,对偶变量直接给出各类资源的影子价格。

对偶变量与 KKT 条件

KKT条件(Karush-Kuhn-Tucker 条件)是一阶必要条件,对偶变量在其中扮演关键角色:

  1. Stationarityf(x)+i=1mλigi(x)=0\nabla f(\mathbf{x}^*) + \sum_{i=1}^{m} \lambda_i^* \nabla g_i(\mathbf{x}^*) = \mathbf{0}
  2. Primal Feasibilitygi(x)0g_i(\mathbf{x}^*) \leq 0
  3. Dual Feasibilityλi0\lambda_i^* \geq 0
  4. Complementary Slacknessλigi(x)=0\lambda_i^* \, g_i(\mathbf{x}^*) = 0

其中互补松弛条件直接连接对偶变量与约束:若约束非紧(gi(x)<0g_i(\mathbf{x}^*) < 0),则 λi=0\lambda_i^* = 0;若对偶变量严格为正(λi>0\lambda_i^* > 0),则约束必为紧约束(gi(x)=0g_i(\mathbf{x}^*) = 0)。这种"一紧一松"的互补关系使得对偶变量能够指示哪些约束是真正的瓶颈。

线性规划中的对偶变量

在标准形式的线性规划中,原始问题与对偶问题中的对偶变量关系最为清晰:

原始问题:

mincTxs.t.Axb,  x0\min \mathbf{c}^T \mathbf{x} \quad \text{s.t.} \quad A\mathbf{x} \geq \mathbf{b},\; \mathbf{x} \geq \mathbf{0}

对偶问题:

maxbTys.t.ATyc,  y0\max \mathbf{b}^T \mathbf{y} \quad \text{s.t.} \quad A^T \mathbf{y} \leq \mathbf{c},\; \mathbf{y} \geq \mathbf{0}

这里的 yRm\mathbf{y} \in \mathbb{R}^m 就是对偶变量向量。由强对偶定理,最优时 cTx=bTy\mathbf{c}^T \mathbf{x}^* = \mathbf{b}^T \mathbf{y}^*。每个 yiy_i 衡量了第 ii 个资源约束的边际价值。在生产经营的语境下,yiy_i 可解读为企业愿意为额外一单位资源 bib_i 支付的最高价格。

拉格朗日对偶中的对偶变量

对于一般的非线性规划,定义拉格朗日对偶函数

θ(λ)=infxL(x,λ)\theta(\boldsymbol{\lambda}) = \inf_{\mathbf{x}} \mathcal{L}(\mathbf{x}, \boldsymbol{\lambda})

对偶函数是对偶变量的函数,给出了原始最优值的一个下界(弱对偶性:θ(λ)f(x)\theta(\boldsymbol{\lambda}) \leq f(\mathbf{x}^*) 对所有 λ0\boldsymbol{\lambda} \geq 0 成立)。对偶问题 maxλ0θ(λ)\max_{\boldsymbol{\lambda} \geq 0} \theta(\boldsymbol{\lambda}) 旨在寻找最紧的下界。当Slater条件等约束品性成立且问题为凸时,强对偶性保证对偶间隙为零,此时最优对偶变量可通过求解对偶问题获得。

与包络定理的联系

对偶变量的边际解释由包络定理严格保证。考虑带参数的优化问题:

V(α)=minxf(x,α)s.t.gi(x,α)0V(\boldsymbol{\alpha}) = \min_{\mathbf{x}} f(\mathbf{x}, \boldsymbol{\alpha}) \quad \text{s.t.} \quad g_i(\mathbf{x}, \boldsymbol{\alpha}) \leq 0

在最优解处,VV 关于参数 αk\alpha_k 的偏导数为拉格朗日函数关于 αk\alpha_k 的偏导数在最优点的取值:

Vαk=Lαk(x,λ)\frac{\partial V}{\partial \alpha_k} = \frac{\partial \mathcal{L}}{\partial \alpha_k}\bigg|_{(\mathbf{x}^*, \boldsymbol{\lambda}^*)}

当参数 αk\alpha_k 恰好是约束的右端项时,该偏导数简化为对应的对偶变量 λk\lambda_k^*。包络定理因此为对偶变量的"边际价值"解释提供了严格的数学基础。

小结

对偶变量不是求解优化问题的副产品,而是理解问题经济结构的核心信息载体。它将物理约束转化为价格信号,揭示稀缺资源的影子价值。从线性规划的影子价格,到消费者理论的边际效用,再到机制设计中的信息租金,对偶变量的思想贯穿经济分析与优化理论始终。