ARTICLE

Lagrange multiplier

拉格朗日乘数 (Lagrange Multiplier) 拉格朗日乘数(Lagrange Multiplier)是最优化理论中求解等式约束优化问题的核心工具,由法国数学家约瑟夫-路易·拉格朗日(Joseph-Louis Lagrange)于18世纪提出。其基本思想是将带约束的优化问题转化为无约束问题:通过引入一个(或多个)辅助变量 ,将约束条件嵌入目标函数,

浏览 0 更新 2025-11-16

拉格朗日乘数 (Lagrange Multiplier)

拉格朗日乘数(Lagrange Multiplier)是最优化理论中求解等式约束优化问题的核心工具,由法国数学家约瑟夫-路易·拉格朗日(Joseph-Louis Lagrange)于18世纪提出。其基本思想是将带约束的优化问题转化为无约束问题:通过引入一个(或多个)辅助变量 λ\lambda,将约束条件嵌入目标函数,构造拉格朗日函数(Lagrangian),从而将原问题的驻点条件转化为拉格朗日函数的无约束驻点条件。该方法不仅给出了求解约束极值的系统化代数步骤,更赋予了乘数 λ\lambda 深刻的经济学含义——它度量了约束资源每放松一单位所带来的目标函数边际变化,即影子价格(Shadow Price)。

几何直觉

理解拉格朗日乘数法的几何本质,需要借助目标函数的等高线(Level Curves)和约束条件的梯度。考虑问题:

maxx,yf(x,y)s.t.g(x,y)=c\max_{x, y} f(x, y) \quad \text{s.t.} \quad g(x, y) = c

其中 ff 为目标函数(如效用、利润),g(x,y)=cg(x, y) = c 为等式约束(如预算线、资源限制)。

在最优解 (x,y)(x^*, y^*) 处,目标函数的等高线 f(x,y)=ff(x, y) = f^* 必定与约束曲线 g(x,y)=cg(x, y) = c 相切。如果两者相交而非相切,沿着约束曲线移动必能到达更高的等高线,从而违背最优性。相切意味着两条曲线在切点处的法向量方向平行,即梯度成比例:

f(x,y)=λg(x,y)\nabla f(x^*, y^*) = \lambda \, \nabla g(x^*, y^*)

其中 f=(f/x,f/y)\nabla f = (\partial f/\partial x, \partial f/\partial y)。比例常数 λ\lambda 就是拉格朗日乘数。这一梯度平行条件加上约束方程 g(x,y)=cg(x^*, y^*) = c,构成了确定 (x,y,λ)(x^*, y^*, \lambda) 的三个方程。

从另一个角度理解,拉格朗日乘数法等价于在 (x,y)(x, y) 平面上寻找目标函数 ff 在约束集上的约束驻点。约束集 {(x,y)g(x,y)=c}\{ (x, y) \mid g(x, y) = c \} 通常是一条曲线,而 ff 在该曲线上取值。问题转化为沿该曲线的一维优化,但拉格朗日方法通过引入 λ\lambda 巧妙地避开了参数化曲线的麻烦,直接在高一维的空间中求解。这种升维策略是拉格朗日方法的核心智慧。

数学表述

对于具有 nn 个变量和 mm 个等式约束的一般问题(m<nm < n):

maxxf(x)s.t.gj(x)=cj,j=1,,m\max_{\mathbf{x}} f(\mathbf{x}) \quad \text{s.t.} \quad g_j(\mathbf{x}) = c_j, \quad j = 1, \ldots, m

构造拉格朗日函数

L(x,λ)=f(x)j=1mλj(gj(x)cj)\mathcal{L}(\mathbf{x}, \boldsymbol{\lambda}) = f(\mathbf{x}) - \sum_{j=1}^{m} \lambda_j \bigl(g_j(\mathbf{x}) - c_j\bigr)

其中 λ=(λ1,,λm)\boldsymbol{\lambda} = (\lambda_1, \ldots, \lambda_m) 为拉格朗日乘数向量。原约束问题的一阶必要条件等价于拉格朗日函数的无约束驻点条件:

Lxi=fxij=1mλjgjxi=0,i=1,,n\frac{\partial \mathcal{L}}{\partial x_i} = \frac{\partial f}{\partial x_i} - \sum_{j=1}^{m} \lambda_j \frac{\partial g_j}{\partial x_i} = 0, \quad i = 1, \ldots, n
Lλj=(gj(x)cj)=0,j=1,,m\frac{\partial \mathcal{L}}{\partial \lambda_j} = -(g_j(\mathbf{x}) - c_j) = 0, \quad j = 1, \ldots, m

λj\lambda_j 求偏导恰好恢复了原约束方程。这一结构保证了 (n+m)(n + m) 个方程求解 (n+m)(n + m) 个未知数。

经济学解释:影子价格

拉格朗日乘数的经济学意义源自包络定理(Envelope Theorem)。将最优解处的目标函数值定义为值函数

V(c)=maxx{f(x)gj(x)=cj}V(\mathbf{c}) = \max_{\mathbf{x}} \{ f(\mathbf{x}) \mid g_j(\mathbf{x}) = c_j \}

包络定理告诉我们,值函数对约束常数 cjc_j 的偏导数恰好等于最优拉格朗日乘数:

Vcj=λj\frac{\partial V}{\partial c_j} = \lambda_j^*

因此,λj\lambda_j^* 度量了第 jj 种资源增加一单位所带来的目标函数增量。例如,在消费者效用最大化问题中,货币收入的拉格朗日乘数就是货币的边际效用;在厂商成本最小化问题中,产量约束的乘数是边际成本。这一解释使得拉格朗日乘数在成本收益分析比较静态分析中不可或缺。

不等式约束与 KKT 条件

当约束包含不等式 hk(x)0h_k(\mathbf{x}) \leq 0 时,拉格朗日乘数法推广为KKT条件(Karush-Kuhn-Tucker Conditions)。构造广义拉格朗日函数:

L(x,λ,μ)=f(x)j=1mλj(gj(x)cj)k=1pμkhk(x)\mathcal{L}(\mathbf{x}, \boldsymbol{\lambda}, \boldsymbol{\mu}) = f(\mathbf{x}) - \sum_{j=1}^{m} \lambda_j (g_j(\mathbf{x}) - c_j) - \sum_{k=1}^{p} \mu_k h_k(\mathbf{x})

其中 μk0\mu_k \geq 0 为不等式约束对应的乘数。KKT 条件在梯度平行条件外增加了互补松弛条件(Complementary Slackness):

μkhk(x)=0,k\mu_k \cdot h_k(\mathbf{x}^*) = 0, \quad \forall k

这意味着:若约束是非紧的(hk(x)<0h_k(\mathbf{x}^*) < 0),则对应乘数 μk=0\mu_k = 0;若乘数为正(μk>0\mu_k > 0),则约束必然是紧的(hk(x)=0h_k(\mathbf{x}^*) = 0)。互补松弛条件精确刻画了"哪些约束真正起作用"的逻辑。

经济学中的应用实例

消费者理论:在 Cobb-Douglas 效用函数 U(x,y)=xαy1αU(x, y) = x^\alpha y^{1-\alpha} 和预算约束 pxx+pyy=Ip_x x + p_y y = I 下,拉格朗日函数为 L=xαy1αλ(pxx+pyyI)\mathcal{L} = x^\alpha y^{1-\alpha} - \lambda(p_x x + p_y y - I)。一阶条件给出 Marshallian 需求函数 x=αI/pxx^* = \alpha I / p_x,乘数 λ=(α/px)α((1α)/py)1α\lambda^* = (\alpha/p_x)^\alpha ((1-\alpha)/p_y)^{1-\alpha} 即为货币的边际效用。该乘数的大小取决于商品价格和偏好参数:价格越高,单位货币能购买的消费束越少,边际效用越低。

厂商成本最小化:给定产量目标 q0q_0 和要素价格 (w,r)(w, r),厂商选择资本 KK 和劳动 LL 以最小化成本 wL+rKwL + rK,受生产函数约束 F(K,L)=q0F(K, L) = q_0。拉格朗日乘数 λ\lambda^* 在此处等于边际成本——多生产一单位产品所需的最小额外支出。结合包络定理,可以证明在最优要素组合处,λ=w/FL=r/FK\lambda^* = w / F_L = r / F_K,即边际成本等于任一要素价格除以其边际产品。这一关系是成本曲线推导的基石。

资产定价:在CAPM中,投资者最大化期望效用受预算约束,拉格朗日乘数对应随机贴现因子的核心参数。在Black-Scholes-Merton模型的衍生品定价中,动态对冲约束的乘数演化为风险市场价格(Market Price of Risk),直接决定了期权定价偏微分方程中漂移项与扩散项之间的权衡关系。

最优增长模型拉姆齐模型(Ramsey Model)中,当前值 Hamiltonian 的协态变量 λ(t)\lambda(t) 扮演拉格朗日乘数的动态角色,其路径刻画了资本积累的影子价格随时间的演化。在最优控制框架下,λ(t)\lambda(t) 满足微分方程 λ˙=ρλH/K\dot{\lambda} = \rho\lambda - \partial H/\partial K,其中 ρ\rho 为时间偏好率,其经济学含义是资本边际价值随时间的衰减速率。

二阶条件与加边海塞矩阵

一阶条件仅为必要条件。在等式约束问题上,充分条件涉及加边海塞矩阵(Bordered Hessian)。定义:

H_B = \begin{pmatrix}

0\mathbf{0} \& \nabla g^T \\ \nabla g \& \nabla^2\_{x\mathbf{x}x\mathbf{x}} L\mathcal{L}

\end{pmatrix}

其中 g\nabla gm×nm \times n 约束雅可比矩阵,xx2L\nabla^2_{\mathbf{x}\mathbf{x}} \mathcal{L} 是拉格朗日函数对 x\mathbf{x}n×nn \times n 海塞矩阵。加边海塞矩阵的主子式符号条件决定了驻点是极大值还是极小值。

局限性与注意事项

拉格朗日乘数法依赖若干关键假设。首先,它要求目标函数和约束函数连续可微;对于不可微问题,需使用次梯度或非光滑优化方法。其次,约束规格(Constraint Qualification)必须满足——即约束梯度的雅可比矩阵在解处满秩,否则 KKT 条件可能不是必要条件。第三,一阶方法仅定位驻点;在非凸问题中,全局最优需借助凸优化理论或数值全局搜索。最后,在存在角点解或边界解的消费理论中,拉格朗日方法需与库恩-塔克条件配合使用。