ARTICLE

几何优化

几何优化 (Geometric Optimization) 几何优化是一类利用问题内在的几何结构——如单调性、齐次性和乘法可分性——将非凸优化问题通过变量变换转化为凸优化问题的方法论。其核心代表是几何规划(Geometric Programming),由 Richard Duffin、Elmor Peterson 和 Clarence Zener 在 20

浏览 8 更新 2025-07-15

几何优化 (Geometric Optimization)

几何优化是一类利用问题内在的几何结构——如单调性、齐次性和乘法可分性——将非凸优化问题通过变量变换转化为凸优化问题的方法论。其核心代表是几何规划(Geometric Programming),由 Richard Duffin、Elmor Peterson 和 Clarence Zener 在 20 世纪 60 年代系统发展。几何优化的独特价值在于,它将大量在原始变量空间中表现为高度非线性和非凸的工程与经济设计问题,通过对数-指数变换映射为凸优化的标准形式,从而保证全局最优解的可计算性。

核心数学结构:单项式与正项式

几何优化的基本构造单元是两类在正象限 R++n\mathbb{R}_{++}^n 上定义的函数。

单项式(Monomial)具有形式:

m(x)=cx1a1x2a2xnan,c>0,  aiRm(\mathbf{x}) = c \, x_1^{a_1} x_2^{a_2} \cdots x_n^{a_n}, \quad c > 0, \; a_i \in \mathbb{R}

其中 cc 为正系数,指数 aia_i 可取任意实数。单项式的关键性质是:取对数后变为仿射函数:

logm(x)=logc+a1logx1++anlogxn\log m(\mathbf{x}) = \log c + a_1 \log x_1 + \cdots + a_n \log x_n

这正是几何优化中变量变换的数学基础。

正项式(Posynomial)是单项式的非负线性组合:

p(x)=k=1Kckx1a1kx2a2kxnank,ck>0p(\mathbf{x}) = \sum_{k=1}^{K} c_k \, x_1^{a_{1k}} x_2^{a_{2k}} \cdots x_n^{a_{nk}}, \quad c_k > 0

正项式在加法下封闭、在非负标量乘法下封闭,但在减法和除法下不封闭。Cobb-Douglas生产函数是典型的单项式,而许多实际成本函数则可表示为正项式。

几何规划的标准形式与变换

一个标准的几何规划问题具有如下形式:

minimizep0(x)subject topi(x)1,i=1,,mmj(x)=1,j=1,,px>0\begin{aligned} \operatorname{minimize} \quad & p_0(\mathbf{x}) \\ \text{subject to} \quad & p_i(\mathbf{x}) \leq 1, \quad i = 1, \ldots, m \\ & m_j(\mathbf{x}) = 1, \quad j = 1, \ldots, p \\ & \mathbf{x} > 0 \end{aligned}

其中 pip_i 是正项式,mjm_j 是单项式。表面上,目标函数和约束均非凸——正项式通常不是凸函数。然而,关键的变换步骤在于引入变量替换:

yi=logxi,xi=eyi,yiRy_i = \log x_i, \quad x_i = e^{y_i}, \quad y_i \in \mathbb{R}

在此变换下,单项式等式约束 mj(x)=1m_j(\mathbf{x}) = 1 变为仿射等式约束 logc+a1y1++anyn=0\log c + a_1 y_1 + \cdots + a_n y_n = 0;正项式不等式约束 pi(x)1p_i(\mathbf{x}) \leq 1 两边取对数后,变为形如 log(kea1ky1++ankyn+logck)0\log\left(\sum_k e^{a_{1k} y_1 + \cdots + a_{nk} y_n + \log c_k}\right) \leq 0 的表达式,其中 loge()\log\sum e^{(\cdot)}对数-和-指数函数——可证明它是凸函数。因此,原始的非凸几何规划被等价地转化为一个凸优化问题,可用内点法高效求解,且任何局部最优解必为全局最优解。

对偶理论

几何规划拥有一个优雅的对偶理论,其形式比一般的拉格朗日对偶更为简洁和强大。对于标准形式的几何规划,其对偶问题本身也是一个只需要求解线性方程组的凸优化问题,且强对偶性在 Slater 条件满足时成立。设原问题的最优值为 pp^*,对偶问题的最优值为 dd^*,则有 dpd^* \leq p^*,且当存在严格可行内点时 d=pd^* = p^*

对偶问题将原问题中关于 nn 个决策变量的非线性优化,转化为关于 KK 个对偶变量(其中 KK 为所有正项式包含的单项式总数)的线性约束下的凹函数最大化问题。这一降维效应——当对偶变量数量小于原变量数量时,求解对偶问题更为经济——是几何规划对偶理论最具实践意义的贡献之一。

广义几何优化与扩展

当允许正项式约束中的系数取负时,传统的对数-指数变换不再保证凸性,问题进入广义几何规划(Generalized Geometric Programming)的范畴。这类问题通常是非凸的,求解依赖于分支定界、逐次凸逼近或启发式算法,不再具有全局最优性的理论保证。

另一扩展方向是S形几何规划(Signomial Programming),其中允许单项式系数为任意实数,目标函数和约束表现为正项式与负项式之差。S形规划在化工过程设计、电路参数优化和结构工程中有大量应用,但其求解本质上属于全局优化问题,需借助特殊的分支策略。

在经济学中的应用

几何优化在经济学和金融学中拥有广泛而自然的应用场景,其根本原因在于大量经济关系天然具有乘法可分和齐次结构。

生产理论与成本函数Cobb-Douglas生产函数 Q=ALαKβQ = A L^\alpha K^\beta 是典型的单项式,而CES生产函数和 Translog 成本函数在取对数后产生正项式结构。在给定要素价格的约束下最小化生产成本,或在给定预算约束下最大化产出,均可直接建模为几何规划问题。该框架自然处理规模报酬可变(指数之和不为 1)、多投入多产出的复杂生产结构,无需将非线性约束线性化。

效用最大化与需求系统Cobb-Douglas效用函数Stone-Geary效用函数(线性支出系统)在预算约束下的效用最大化问题可转化为几何规划的标准形式。特别是 Stone-Geary 效用函数中的"生存水平"参数产生了非齐次的正项式约束,几何规划框架恰好提供了系统化的求解路径,避免了拉格朗日乘子法在高维情形下的繁琐代数。

投资组合优化:在考虑交易成本、整数持股约束或最大化几何平均收益(Kelly 准则)时,问题常呈现单项式和正项式结构。几何规划方法可在此类问题中提供高效的全局最优解。

环境经济学与资源管理:污染治理成本函数常呈现幂律形式(如去除率与成本的幂律关系),多个污染源的联合治理成本最小化自然构成几何规划问题。

与其他优化方法的关系

几何优化与凸优化是子集与超集的关系——每一个几何规划在对数变换后等价于一个凸优化问题,但不是所有凸优化问题都能表示为几何规划。几何优化的优势在于:它为具有乘法可分结构的问题提供了一个领域专用语言,使建模者无需手动推导凸性条件。

线性规划相比,几何规划能自然地处理非线性但具有正项式结构的关系,避免了近似线性化带来的精度损失。与一般的非线性规划相比,几何规划的对数-指数变换保证了变换后问题的凸性,从而使全局最优解在理论上有保障、在算法上可高效达到。

在数值求解方面,现代凸优化求解器(如 CVX、Gurobi、MOSEK)均支持几何规划的直接建模和求解。用户只需以原始的非凸正项式形式描述问题,求解器自动执行对数-指数变换并调用内点法,透明地利用凸性保证全局收敛。

总结

几何优化通过利用乘法可分和正系数函数的内在几何结构,将一类广泛存在于经济学、工程和科学中的非凸优化问题转化为凸优化问题,从而确保了全局最优性和计算可解性。其核心理念——通过对数变换揭示隐藏在非线性结构之下的凸性——超越了具体的技术细节,为建模者提供了一种辨识和利用问题内在结构的思维方式。在生产理论效用最大化、投资组合设计和环境资源管理等经济学核心领域,几何优化框架将继续提供高效且理论完备的定量分析工具。