知经 KNOWECON · 卓越的经济金融统计数学学习平台

拉格朗日函数

# 拉格朗日函数 (Lagrange Function)

拉格朗日函数 (Lagrange Function) 是一种在数学{{{优化}}}理论中至关重要的工具,它将一个受{{{等式约束}}} (Equality Constraints) 的优化问题转化为一个无约束的等价问题。通过构建并分析此函数,我们可以使用{{{微积分}}}的方法找到原问题目标函数的{{{极值}}}点(最大值或最小值)。这一方法被称为 拉格朗日乘数法 (Method of Lagrange Multipliers)。

该函数在经济学、金融学、物理学、工程学和统计学等领域有着广泛的应用,尤其是在处理资源稀缺性下的最优选择问题时,例如消费者的{{{效用最大化}}}或生产者的{{{成本最小化}}}。

## 函数的构建

假设我们面临一个标准的约束优化问题: 需要优化的 {{{目标函数}}} (Objective Function) 为 $f(x_1, x_2, \ldots, x_n)$。 同时,该问题受到 $m$ 个 等式约束 的限制,其形式为: $$ \begin{cases} g_1(x_1, \ldots, x_n) = c_1 \\ g_2(x_1, \ldots, x_n) = c_2 \\ \vdots \\ g_m(x_1, \ldots, x_n) = c_m \end{cases} $$ 为了解决这个问题,我们引入 $m$ 个新的变量 $\lambda_1, \lambda_2, \ldots, \lambda_m$,这些变量被称为 {{{拉格朗日乘数}}} (Lagrange Multipliers)。每一个乘数对应一个约束条件。

拉格朗日函数 $L$ 被定义为目标函数与一系列“约束函数乘以其对应拉格朗日乘数”的差。通常,约束条件会被重写为 $g_j(\mathbf{x}) - c_j = 0$ 的形式。因此,拉格朗日函数的形式为: $$ L(x_1, \ldots, x_n, \lambda_1, \ldots, \lambda_m) = f(x_1, \ldots, x_n) - \sum_{j=1}^{m} \lambda_j (g_j(x_1, \ldots, x_n) - c_j) $$ 使用更紧凑的{{{向量}}}表示法,令 $\mathbf{x} = (x_1, \ldots, x_n)^\top$ 和 $\boldsymbol{\lambda} = (\lambda_1, \ldots, \lambda_m)^\top$,函数可以写作: $$ L(\mathbf{x}, \boldsymbol{\lambda}) = f(\mathbf{x}) - \boldsymbol{\lambda}^\top (\mathbf{g}(\mathbf{x}) - \mathbf{c}) $$ 此时,原先的约束优化问题就转化为了寻找拉格朗日函数 $L$ 的{{{临界点}}} (Critical Points) 的问题。

## 拉格朗日乘数法的一阶条件

拉格朗日乘数法的核心思想是,在受约束的极值点上,目标函数的{{{梯度}}}向量必然是所有约束函数梯度向量的{{{线性组合}}}。拉格朗日函数巧妙地将这个几何条件代数化了。

对于一个在可行域内部的最优解,其必要条件是拉格朗日函数 $L$ 对其所有变量(包括原始变量 $\mathbf{x}$ 和拉格朗日乘数 $\boldsymbol{\lambda}$)的{{{偏导数}}}均为零。这构成了一个方程组:

1. 对 $x_i$ 求偏导数 ($i = 1, \ldots, n$): $$ \frac{\partial L}{\partial x_i} = \frac{\partial f}{\partial x_i} - \sum_{j=1}^{m} \lambda_j \frac{\partial g_j}{\partial x_i} = 0 $$

2. 对 $\lambda_j$ 求偏导数 ($j = 1, \ldots, m$): $$ \frac{\partial L}{\partial \lambda_j} = -(g_j(\mathbf{x}) - c_j) = 0 \quad \implies \quad g_j(\mathbf{x}) = c_j $$

求解这个由 $n+m$ 个方程组成的方程组,得到的解 $(\mathbf{x}^*, \boldsymbol{\lambda}^*)$ 就是原约束优化问题的候选解。值得注意的是,对 $\lambda_j$ 求导的方程恰好还原了原始的约束条件,这保证了我们找到的解是满足约束的。

## 几何直观解释

拉格朗日乘数法的原理可以通过几何直观地理解。考虑一个简单的二维例子:最大化函数 $f(x, y)$,同时满足约束条件 $g(x, y) = c$。

* {{{等高线}}} (Level Sets):函数 $f(x, y)$ 的所有点可以由一系列等高线 $f(x, y) = k$ 来表示。我们的目标是找到约束曲线 $g(x, y) = c$ 上的一个点,使得该点所在的 $f$ 函数的等高线值 $k$ 最大(或最小)。 * 相切条件:在最优点,函数 $f$ 的等高线必然与约束曲线 $g$ 相切。如果它们不相切而是相交,那么我们总可以沿着约束曲线 $g$ 移动一小段距离,从而到达一个具有更高(或更低)函数值的 $f$ 等高线上。这就意味着当前点不是极值点。 * 梯度向量:在任意一点,一个函数的{{{梯度}}}向量 $\nabla f$ 的方向与该点的等高线{{{正交}}}(垂直)。 * 梯度共线:当两条曲线在某一点相切时,它们在该点的法线(垂直于切线的线)是重合的。这意味着,在最优点 $(x^*, y^*)$,目标函数 $f$ 的梯度向量 $\nabla f(x^*, y^*)$ 和约束函数 $g$ 的梯度向量 $\nabla g(x^*, y^*)$ 必须是平行的(即方向相同或相反)。 * 数学表达:两个向量平行,意味着其中一个向量可以表示为另一个向量的标量倍。即: $$ \nabla f(x^*, y^*) = \lambda \nabla g(x^*, y^*) $$ 其中 $\lambda$ 就是一个标量,即拉格朗日乘数。移项后可得: $$ \nabla f(x^*, y^*) - \lambda \nabla g(x^*, y^*) = \mathbf{0} $$ 这正是我们从拉格朗日函数 $L(x, y, \lambda) = f(x, y) - \lambda(g(x, y) - c)$ 对 $x$ 和 $y$ 求偏导并令其为零所得到的方程组。

## 拉格朗日乘数的经济学解释

在经济学和金融学中,拉格朗日乘数 $\lambda$ 具有极其重要的经济意义,它通常被称为{{{影子价格}}} (Shadow Price) 或边际价值。

具体来说,在最优点上求得的拉格朗日乘数 $\lambda_j^*$ 的值,衡量了当第 $j$ 个约束条件 $g_j(\mathbf{x}) = c_j$ 中的常数 $c_j$ 发生微小变化时,目标函数 $f$ 的最优值 $f^*$ 会发生多大的变化。数学上表示为: $$ \lambda_j^* = \frac{df^*(\mathbf{c})}{dc_j} $$ 其中 $f^*(\mathbf{c})$ 是作为约束常数值 $\mathbf{c}$ 的函数的最优目标函数值。

示例: 1. 消费者理论:在最大化{{{效用函数}}} $U(x_1, x_2)$ 并受制于{{{预算约束}}} $p_1x_1 + p_2x_2 = M$ 的问题中,拉格朗日乘数 $\lambda$ 代表 收入的{{{边际效用}}}。它表示当消费者的收入 $M$ 增加 $1 时,其能够获得的最大效用会增加多少。 2. 企业生产:在最小化成本 $C(K, L)$ 并受制于产量目标 $Q(K, L) = Q_0$ 的问题中,拉格朗日乘数 $\lambda$ 代表在最优生产组合下,增加一单位产量的 {{{边际成本}}}

## 案例分析:柯布-道格拉斯效用最大化

假设一个消费者的效用函数为 {{{柯布-道格拉斯效用函数}}} $U(x, y) = x^{0.5} y^{0.5}$,商品 $x$ 和 $y$ 的价格分别为 $p_x = $2$ 和 $p_y = $4$,消费者的收入为 $M = $100$。求能使消费者效用最大化的商品组合 $(x, y)$。

1. 构建拉格朗日函数 目标函数:$f(x, y) = x^{0.5} y^{0.5}$ 约束条件:$2x + 4y = 100$ 拉格朗日函数为: $$ L(x, y, \lambda) = x^{0.5} y^{0.5} - \lambda(2x + 4y - 100) $$

2. 一阶条件 对 $x, y, \lambda$ 求偏导并令其为零: $$ \begin{align*} \frac{\partial L}{\partial x} &= 0.5x^{-0.5} y^{0.5} - 2\lambda = 0 \quad &(1) \\ \frac{\partial L}{\partial y} &= 0.5x^{0.5} y^{-0.5} - 4\lambda = 0 \quad &(2) \\ \frac{\partial L}{\partial \lambda} &= -(2x + 4y - 100) = 0 \quad &(3) \end{align*} $$

3. 求解方程组 从(1)和(2)中解出 $\lambda$: $$ \lambda = \frac{0.5x^{-0.5} y^{0.5}}{2} = \frac{y^{0.5}}{4x^{0.5}} $$ $$ \lambda = \frac{0.5x^{0.5} y^{-0.5}}{4} = \frac{x^{0.5}}{8y^{0.5}} $$ 令两者相等: $$ \frac{y^{0.5}}{4x^{0.5}} = \frac{x^{0.5}}{8y^{0.5}} \implies 8y = 4x \implies x=2y $$ 这个结果 $\frac{MU_x}{MU_y} = \frac{p_x}{p_y}$,即{{{边际替代率}}}等于价格比,是消费者均衡的标志。

将 $x=2y$ 代入约束条件(3): $$ 2(2y) + 4y = 100 \implies 8y = 100 \implies y^* = 12.5 $$ 因此,$x^* = 2(12.5) = 25$。 最优消费组合为 $(x^*, y^*) = (25, 12.5)$。此时,$\lambda = \frac{12.5^{0.5}}{4 \cdot 25^{0.5}} = \frac{\sqrt{12.5}}{20} \approx 0.177$。这意味着收入增加 $1,消费者的最大效用将增加约 0.177 个单位。

## 进一步讨论

* 二阶条件:一阶条件仅为极值点的必要条件,非充分条件。要判断候选点是最大值、最小值还是{{{鞍点}}},需要检验二阶条件,这通常涉及分析 加边海森矩阵 (Bordered Hessian Matrix) 的{{{定号性}}}。 * {{{不等式约束}}}:当优化问题包含不等式约束(例如 $g(\mathbf{x}) \le c$)时,拉格朗日乘数法需要被推广为更一般化的 {{{卡鲁什-库恩-塔克条件}}} (Karush-Kuhn-Tucker, KKT)