ARTICLE

拟凸函数

拟凸函数 (Quasiconvex Function) 拟凸函数 (Quasiconvex Function) 是数学分析和数理优化中的一类重要函数,可以视为凸函数 (Convex Function) 概念的推广。与凸函数相比,拟凸函数的要求更弱,因此其适用范围更广。拟凸函数及其对偶概念——拟凹函数 (Quasiconcave Function),在经济学、

浏览 45 更新 2025-10-12

拟凸函数 (Quasiconvex Function)

拟凸函数 (Quasiconvex Function) 是数学分析数理优化中的一类重要函数,可以视为凸函数 (Convex Function) 概念的推广。与凸函数相比,拟凸函数的要求更弱,因此其适用范围更广。拟凸函数及其对偶概念——拟凹函数 (Quasiconcave Function),在经济学运筹学和工程学等领域有广泛应用,尤其是在描述非典型的成本结构和进行最优化决策时。

正式定义 (Formal Definitions)

一个定义在凸集 (Convex Set) SRn S \subseteq \mathbb{R}^n 上的实值函数 f:SR f: S \to \mathbb{R} 被称为拟凸函数,如果它满足以下几个等价条件中的任意一个。

定义一:基于下水平集

这是最直观且最常用的定义。函数 f f 是拟凸的,当且仅当它的所有 下水平集 (Lower Level Sets) 都是凸集。

对于任意实数 αR \alpha \in \mathbb{R} ,函数 f f 的下水平集 Lα L_\alpha 定义为:

Lα={xSf(x)α}L_\alpha = \{x \in S \mid f(x) \le \alpha\}

如果对于每一个 α \alpha ,集合 Lα L_\alpha 都是一个凸集,那么 f f 就是一个拟凸函数。

从几何上看,这意味着对于函数图像上的任意“高度” α \alpha ,所有低于或等于该高度的点所对应的定义域子集,必须是一个连通的、没有“洞”或“分离部分”的凸集。

定义二:基于函数值比较

这个定义类似于凸函数詹森不等式 (Jensen's Inequality),但条件更宽松。函数 f f 是拟凸的,当且仅当对于其定义域 S S 中的任意两点 x1,x2 x_1, x_2 和任意 θ[0,1] \theta \in [0, 1] ,以下不等式成立:

f(θx1+(1θ)x2)max{f(x1),f(x2)}f(\theta x_1 + (1-\theta)x_2) \le \max\{f(x_1), f(x_2)\}

这个不等式表明,连接定义域中任意两点的线段上,所有点的函数值都不会超过这两端点函数值的最大值。

作为对比,凸函数的定义要求更强:

f(θx1+(1θ)x2)θf(x1)+(1θ)f(x2)f(\theta x_1 + (1-\theta)x_2) \le \theta f(x_1) + (1-\theta)f(x_2)

由于加权平均值 θf(x1)+(1θ)f(x2) \theta f(x_1) + (1-\theta)f(x_2) 必然小于或等于最大值 max{f(x1),f(x2)} \max\{f(x_1), f(x_2)\} ,因此任何凸函数都必然是拟凸函数。

拟凸函数的性质与特点

与凸函数的关系

  1. 所有凸函数都是拟凸函数。这一点可以从上述定义二的比较中直接看出。
  2. 并非所有拟凸函数都是凸函数。这是拟凸函数作为推广概念的核心。一个典型的例子是定义在 R \mathbb{R} 上的函数 f(x)=x3 f(x) = x^3
  • 它是拟凸的:因为其下水平集 Lα={xRx3α}=(,α3] L_\alpha = \{x \in \mathbb{R} \mid x^3 \le \alpha\} = (-\infty, \sqrt[3]{\alpha}] 是一个区间,而区间是凸集。
  • 它不是凸的:因为它的二阶导数 f(x)=6x f''(x) = 6x x<0 x<0 时为负,不满足凸函数二阶导数非负的条件。

其他非凸的拟凸函数例子包括单调函数、以及具有“U”形但底部平坦或不光滑的函数。

与拟凹函数的关系

一个函数 f f 拟凹函数 (Quasiconcave Function),当且仅当 f -f 是一个拟凸函数。相应地,拟凹函数的上水平集 (Upper Level Sets) 是凸集。在经济学中,效用函数生产函数通常被假设为拟凹函数。

如果一个函数既是拟凸的又是拟凹的,则称其为 拟线性函数 (Quasilinear Function)。在单变量情况下,这意味着函数是单调的 (Monotonic)。

在最优化中的重要性

拟凸函数在最优化理论中具有一个非常重要的性质:对于一个拟凸函数,任何局部极小值 (Local Minimum) 同时也是它的全局极小值 (Global Minimum)

逻辑解释:假设 x x^* 是一个局部极小值,但不是全局极小值。这意味着存在一个点 y y ,使得 f(y)<f(x) f(y) < f(x^*) 。现在考虑连接 y y x x^* 的线段上的点 z(θ)=θy+(1θ)x z(\theta) = \theta y + (1-\theta)x^* ,其中 θ(0,1] \theta \in (0, 1] 。根据拟凸函数的定义,我们有 f(z(θ))max{f(y),f(x)}=f(x) f(z(\theta)) \le \max\{f(y), f(x^*)\} = f(x^*) 。这意味着在线段上任意接近 x x^* 的点,其函数值都不会超过 f(x) f(x^*) 。这与 x x^* 是一个严格局部极小值的概念相矛盾。因此,一个局部极小点必须是全局最小的。(注意:全局最小值可能不止一个,所有全局最小点构成的集合是一个凸集)。

这个性质使得求解拟凸优化问题(在一个凸集上最小化一个拟凸函数)成为可能,尽管其难度高于传统的凸优化 (Convex Optimization),但仍然可以通过如二分法等有效算法求解。

在经济学中的应用

虽然经济学中的效用理论生产理论更多地使用拟凹函数,但拟凸函数在描述成本和某些特定偏好时同样至关重要。

一个经典的应用是模拟企业的 U形平均成本曲线 (Average Cost Curve)

  • 在生产初期,由于存在规模经济 (Economies of Scale)(例如,专业化分工、固定成本分摊),企业的平均成本会随着产量的增加而下降。
  • 当产量超过某个点后,由于管理变得复杂、生产要素效率降低等规模不经济 (Diseconomies of Scale) 的出现,平均成本会转而上升。

这种先下降后上升的“U”形曲线,就是一个典型的拟凸函数。它不一定是凸函数(例如,下降段的曲率可能不满足凸性要求),但它满足拟凸函数的定义:任何低于或等于某一成本水平 α \alpha 的产量区间,都是一个连续的区间(即凸集)。

企业的目标之一是找到使平均成本最小化的产量水平。由于平均成本函数是拟凸的,其局部最小值(即成本曲线的谷底)就是全局最小值。这为企业寻找最优生产规模提供了理论依据。