局部极值 (Local Extremum)
局部极值是数学分析与最优化理论中的基本概念,指函数在某点的一个邻域内取得的最大值或最小值。与全局极值(在整个定义域上的极值)不同,局部极值仅要求在局部范围内最优。在经济学中,局部极值广泛出现在效用最大化、利润最大化、成本最小化等优化问题中,是边际分析的数学基石。理解局部极值的条件与性质,是掌握微观经济学、计量经济学和博弈论中均衡分析的先决条件。
定义与分类
设 f:D⊆Rn→R,点 x∗∈D。
局部极大值:存在 δ>0,使得对所有满足 ∥x−x∗∥<δ 的 x∈D,有 f(x)≤f(x∗)。若不等式严格成立(x=x∗),则为严格局部极大值。
局部极小值:存在 δ>0,使得对所有满足 ∥x−x∗∥<δ 的 x∈D,有 f(x)≥f(x∗)。若不等式严格成立,则为严格局部极小值。
局部极大值和局部极小值统称为局部极值。全局极值必然是局部极值,反之不成立。凸函数的任一局部极小值都是全局极小值,这是凸优化在经济学中极为重要的原因。
无约束优化的一阶必要条件
若 f 在 x∗ 处可微且 x∗ 为局部极值,则梯度为零向量:
∇f(x∗)=0
即所有一阶偏导数同时为零。满足该条件的点称为驻点(Stationary Point)或临界点。一阶条件是极值的必要而非充分条件——鞍点也满足梯度为零但不为极值。例如,f(x,y)=x2−y2 在 (0,0) 处的梯度为零,但该点为鞍点:沿 x 方向为极小,沿 y 方向为极大。
二阶条件
对于单变量函数 f:R→R,二阶条件提供了极值的充分判别:
- 局部极小值:f′(x∗)=0 且 f′′(x∗)>0。
- 局部极大值:f′(x∗)=0 且 f′′(x∗)<0。
- 若 f′′(x∗)=0,需检验更高阶导数(如 泰勒展开 分析)。
对于多变量函数,二阶条件涉及海森矩阵 Hf(x∗):
- 局部极小值:海森矩阵正定(所有特征值 > 0)。
- 局部极大值:海森矩阵负定(所有特征值 < 0)。
- 若海森矩阵不定(既有正特征值又有负特征值),该点为鞍点。
- 若海森矩阵半正定或半负定但不满足定号性,二阶条件不足以判别。
约束优化中的局部极值
在约束优化问题中,局部极值的判定需借助拉格朗日乘数法或KKT条件(Karush-Kuhn-Tucker 条件)。对于问题:
xmaxf(x)s.t.gi(x)≤0,hj(x)=0
KKT 条件在局部极值点处成立(在适当的约束规格下):存在乘子 λi≥0 和 μj,使得 ∇f+∑λi∇gi+∑μj∇hj=0,且 λigi=0(互补松弛)。
经济学中的应用
利润最大化:企业选择产量 q 最大化利润 π(q)=R(q)−C(q)。一阶条件 MR(q∗)=MC(q∗)(边际收益等于边际成本)给出驻点,二阶条件要求 MR′(q∗)<MC′(q∗)(边际收益的斜率小于边际成本的斜率),确保该点为局部极大值。
效用最大化:消费者在预算约束下最大化效用函数 u(x),极值点满足边际替代率等于价格比。效用函数的拟凹性保证一阶条件确定的驻点为全局最大值。
最小二乘法:OLS 估计量 β^ 最小化残差平方和 S(β)=∥y−Xβ∥2。一阶条件导出正规方程 X′Xβ^=X′y,海森矩阵 2X′X 的正定性保证解为全局极小值。
博弈论:纳什均衡本质上是一组策略下每个参与者的收益函数在其自身策略空间上的局部(通常也是全局)极值点,反映了策略的相互最优响应性质。
局部极值与数值优化
在计算经济学中,梯度下降、牛顿法等数值算法迭代逼近局部极小值。算法收敛到的是局部极值还是全局极值取决于目标函数的性质(凸性)和初始点的选择。机器学习中的损失函数通常非凸(如神经网络),随机梯度下降可能陷入较差的局部极值,但实践中常因过参数化和高维空间的特殊几何性质而仍能找到较优解。