# 拟凸 (Quasiconvexity)
拟凸性 (Quasiconvexity) 是{{{数学分析}}}和{{{最优化理论}}}中的一个重要概念,它描述了一类比{{{凸性}}} (Convexity) 更为宽泛的{{{函数}}} (function) 性质。在经济学中,拟凸和与其相关的拟凹概念在分析消费者{{{偏好}}}和{{{生产技术}}}时扮演着核心角色。
一个函数被称为 拟凸函数 (Quasiconvex Function),如果其所有的 {{{下水平集}}} (Lower Level Sets) 都是{{{凸集}}} (Convex Sets)。
## 形式化定义
设有定义在凸集 $S \subseteq \mathbb{R}^n$ 上的实值函数 $f: S \to \mathbb{R}$。以下两种定义是等价的:
定义 1 (基于水平集): 函数 $f$ 是拟凸的,如果对于任意实数 $\alpha \in \mathbb{R}$,其下水平集 $$ L_\alpha = \{ x \in S \mid f(x) \leq \alpha \} $$ 都是一个凸集。
这意味着,如果点 $x$ 和点 $y$ 都在一个特定的下水平集中(即 $f(x) \leq \alpha$ 且 $f(y) \leq \alpha$),那么连接 $x$ 和 $y$ 的整个线段上的任意一点 $z = \lambda x + (1-\lambda)y$(其中 $\lambda \in [0, 1]$)也必定在该下水平集中(即 $f(z) \leq \alpha$)。
定义 2 (基于函数值不等式): 函数 $f$ 是拟凸的,如果对于任意的 $x, y \in S$ 和任意的 $\lambda \in [0, 1]$,以下不等式成立: $$ f(\lambda x + (1-\lambda)y) \leq \max\{f(x), f(y)\} $$ 这个不等式直观地说明,在任意两点之间的线段上,函数的取值不会超过这两点函数值的最大值。这与{{{凸函数}}}的定义 $f(\lambda x + (1-\lambda)y) \leq \lambda f(x) + (1-\lambda)f(y)$ 形成了对比。
## 与凸函数的关系
拟凸性是凸性的一个重要推广。二者之间有明确的层级关系。
1. 所有{{{凸函数}}}都是拟凸函数。 这是因为对于一个凸函数,我们有 $f(\lambda x + (1-\lambda)y) \leq \lambda f(x) + (1-\lambda)f(y)$。而任意两数 $f(x)$ 和 $f(y)$ 的{{{加权平均}}} $\lambda f(x) + (1-\lambda)f(y)$ 总是小于或等于它们的最大值 $\max\{f(x), f(y)\}$。因此,以下关系链成立: $$ f(\lambda x + (1-\lambda)y) \leq \lambda f(x) + (1-\lambda)f(y) \leq \max\{f(x), f(y)\} $$ 所以,满足凸性定义的函数必然满足拟凸性的定义。
2. 拟凸函数不一定是凸函数。 这是两者最关键的区别。拟凸函数允许出现“平坦”区域,甚至可以是不连续的,而这些行为通常会破坏函数的凸性。 示例: * 函数 $f(x) = \sqrt{|x|}$ 对 $x \in \mathbb{R}$ 是一个拟凸函数,但它不是凸函数。它的下水平集是形如 $[ -a, a ]$ 的闭区间,是凸集。但它在原点附近的变化不满足凸性的要求。 * 向上取整函数 $f(x) = \lceil x \rceil$ 是一个非递减的阶梯函数。它是拟凸的,因为它的下水平集是形如 $(-\infty, a]$ 的区间(凸集)。但它显然不是凸函数。 * 任何单调(非递减或非递增)的一元函数都是拟凸的。例如 $f(x) = x^3$ 在整个实数域上是拟凸且拟凹的,但它在 $x<0$ 的区域是凹的,在 $x>0$ 的区域是凸的,因此在整个定义域上既不凸也不凹。
从几何上看,凸函数图像的弦(连接曲线上两点的线段)必须位于曲线的上方。而对于拟凸函数,没有这样的要求。拟凸函数只要求其“山谷”不能有多个分离的底部,即所有低于某一水平的点必须形成一个连通的凸区域。
## 拟凸函数的性质
* 最优化:在{{{最优化}}}问题中,拟凸性是一个非常有用的性质。对于一个定义在凸集上的 严格拟凸函数 (Strictly Quasiconvex Function),任何{{{局部最小值}}}都必然是它的{{{全局最小值}}}。这大大简化了寻优过程。然而,对于非严格的拟凸函数,可能存在一个平坦的区域,使得有无穷多个非全局的局部最小值。 * 和与复合:两个拟凸函数的和不一定是拟凸的(这与凸函数不同)。但是,如果 $g: \mathbb{R}^n \to \mathbb{R}$ 是拟凸的,而 $h: \mathbb{R} \to \mathbb{R}$ 是一个非递减函数,则复合函数 $f(x) = h(g(x))$ 是拟凸的。 * 最大值:一系列拟凸函数的逐点最大值(pointwise maximum)也是拟凸的。
## 相关的概念
### 拟凹函数 (Quasiconcave Function)
与拟凸性相对应的是 拟凹性 (Quasiconcavity)。一个函数 $f$ 被称为 拟凹函数,如果其 {{{上水平集}}} (Upper Level Sets) 是凸集。
定义: 函数 $f: S \to \mathbb{R}$ 是拟凹的,如果对于任意实数 $\alpha$,其上水平集 $$ U_\alpha = \{ x \in S \mid f(x) \geq \alpha \} $$ 都是一个凸集。
等价地,对于任意的 $x, y \in S$ 和任意的 $\lambda \in [0, 1]$,以下不等式成立: $$ f(\lambda x + (1-\lambda)y) \geq \min\{f(x), f(y)\} $$ 一个函数 $f$ 是拟凹的,当且仅当 $-f$ 是一个拟凸函数。
在{{{微观经济学}}}中,拟凹性比拟凸性更常见。例如,一个具有良好性质的{{{效用函数}}}通常被假定为拟凹的。这意味着如果消费者对商品束 $x$ 和 $y$ 的偏好是无差异的(或 $x$ 和 $y$ 提供了至少为 $\alpha$ 的效用),那么这些商品束的任意加权平均组合 $z = \lambda x + (1-\lambda)y$ 将提供至少与 $x$ 和 $y$ 中较差者一样高(通常是更高)的效用。这对应了经济学中“偏好平均胜过极端”的{{{凸偏好}}}假设,其几何表现为{{{无差异曲线}}}凸向原点。
### 伪凸函数 (Pseudoconvex Function)
在可微函数的研究中,还有一个介于凸性和拟凸性之间的概念,称为 伪凸性 (Pseudoconvexity)。 一个在开凸集 $S$ 上可微的函数 $f$ 被称为伪凸函数,如果对于任意 $x, y \in S$,满足: $$ \nabla f(x)^T (y-x) \geq 0 \implies f(y) \geq f(x) $$ 其中 $\nabla f(x)$ 是 $f$ 在点 $x$ 的{{{梯度}}}。这个性质意味着,如果函数在点 $x$ 沿着指向 $y$ 的方向是“非递减”的,那么 $y$ 点的函数值一定不会小于 $x$ 点的函数值。
所有可微的凸函数都是伪凸函数,所有伪凸函数都是拟凸函数。这个概念在{{{KKT条件}}}等最优化理论中非常关键,因为它保证了任何满足 $\nabla f(x^*) = 0$ 的{{{驻点}}} $x^*$ 都是全局最小值。