知经 KNOWECON · 卓越的经济金融统计数学学习平台

临界点

# 临界点 (Critical Point)

临界点 (Critical Point) 是{{{微积分}}}和{{{数学分析}}}中的一个基本概念,尤其在研究函数性质和解决{{{优化}}}问题时至关重要。一个函数的临界点是指其{{{定义域}}}内,该函数的{{{导数}}}为零或导数不存在的点。这些点是函数可能取得{{{局部极大值}}}或{{{局部极小值}}}的“候选点”。

临界点的研究构成了分析函数行为的基石,它使得我们能够系统性地寻找函数的极值,这在{{{经济学}}}(如{{{利润最大化}}}或{{{成本最小化}}})、{{{物理学}}}(如寻找系统的稳定平衡点)以及{{{统计学}}}(如{{{最大似然估计}}})等领域均有广泛应用。

## 形式化定义

临界点的定义根据函数的变量数目有所不同。

### 单变量函数 (Single-Variable Functions)

对于一个定义在开区间 $I$ 上的实值函数 $f(x)$,其定义域内的一个点 $c$ 被称为临界点,如果它满足以下两个条件之一:

1. $f'(c) = 0$ :函数在点 $c$ 的导数等于零。在几何上,这意味着函数在点 $(c, f(c))$ 处的{{{切线}}}是水平的。这类点也被称为驻点 (Stationary Point)。 2. $f'(c)$ 不存在:函数在点 $c$ 的导数不存在。在几何上,这通常对应于函数图像上的一个尖点 (cusp)角点 (corner)

示例 1:导数为零 考虑函数 $f(x) = x^3 - 3x$。其导数为 $f'(x) = 3x^2 - 3$。 令 $f'(x) = 0$,我们得到 $3x^2 - 3 = 0$,解得 $x = 1$ 和 $x = -1$。 因此,$x=1$ 和 $x=-1$ 是函数 $f(x)$ 的临界点(且均为驻点)。

示例 2:导数不存在 考虑函数 $f(x) = (x-2)^{2/3}$。其导数为 $f'(x) = \frac{2}{3}(x-2)^{-1/3} = \frac{2}{3\sqrt[3]{x-2}}$。 当 $x=2$ 时,导数的分母为零,因此 $f'(2)$ 不存在。 所以,$x=2$ 是函数 $f(x)$ 的一个临界点。该点在图像上表现为一个尖点。

## 临界点与极值

临界点之所以重要,是因为它们与函数的{{{局部极值}}}({{{局部极大值}}}和{{{局部极小值}}})密切相关。根据{{{费马引理 (Fermat's Theorem on Stationary Points)}}},如果函数 $f$ 在点 $c$ 处取得局部极值,并且 $f'(c)$ 存在,那么必然有 $f'(c) = 0$。

这一定理的启示是:一个可微函数的所有局部极值点必定是临界点。因此,要寻找一个函数的局部极值,我们只需要在其临界点和定义域的端点中进行搜索即可,这极大地缩小了搜索范围。

然而,临界点不一定是极值点。例如,函数 $f(x) = x^3$ 在 $x=0$ 处的导数 $f'(0)=0$,所以 $x=0$ 是一个临界点。但是,$f(x)$ 在 $x=0$ 附近是严格单调递增的,该点并非极值点,而是一个{{{拐点}}}。

为了判断一个临界点是否为极值点,以及是哪种极值点,我们通常使用以下两种判别法。

### 一阶导数判别法 (First Derivative Test)

该方法通过考察临界点两侧导数的符号变化来判断极值的类型。假设 $c$ 是函数 $f$ 的一个临界点:

* 如果导数 $f'(x)$ 在经过 $c$ 点时,符号由正变负,则函数在 $c$ 处取得一个{{{局部极大值}}}。 * 如果导数 $f'(x)$ 在经过 $c$ 点时,符号由负变正,则函数在 $c$ 处取得一个{{{局部极小值}}}。 * 如果导数 $f'(x)$ 在经过 $c$ 点时,符号不发生改变,则 $c$ 不是局部极值点。

### 二阶导数判别法 (Second Derivative Test)

对于驻点(即 $f'(c)=0$ 的临界点),二阶导数判别法提供了一种更为便捷的判断方式。假设函数 $f$ 在点 $c$ 附近存在二阶导数:

* 如果 $f''(c) > 0$,则函数在 $c$ 处取得一个{{{局部极小值}}}。这对应于函数在该点处是{{{凸函数}}}(凹口向上)。 * 如果 $f''(c) < 0$,则函数在 $c$ 处取得一个{{{局部极大值}}}。这对应于函数在该点处是{{{凹函数}}}(凹口向下)。 * 如果 $f''(c) = 0$,则此判别法失效,需要使用一阶导数判别法或其他更高阶的测试来判断。

## 多变量函数的临界点

对于多变量函数,例如 $f(x_1, x_2, \ldots, x_n)$,临界点的概念可以被推广。一个点 $\mathbf{c} = (c_1, c_2, \ldots, c_n)$ 被称为函数 $f$ 的临界点,如果:

1. 函数在该点的{{{梯度 (Gradient)}}}为零向量,即 $\nabla f(\mathbf{c}) = \mathbf{0}$。 2. 或者,函数在该点的梯度不存在(即至少有一个{{{偏导数}}}不存在)。

梯度的定义为所有偏导数构成的向量:$\nabla f = \left(\frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \ldots, \frac{\partial f}{\partial x_n}\right)$。因此,条件1意味着所有的一阶偏导数在该点都为零: $$ \frac{\partial f}{\partial x_1}(\mathbf{c}) = 0, \quad \frac{\partial f}{\partial x_2}(\mathbf{c}) = 0, \quad \ldots, \quad \frac{\partial f}{\partial x_n}(\mathbf{c}) = 0 $$ 在几何上,对于二元函数 $f(x, y)$,这表示函数在临界点处的{{{切平面}}}是水平的。

类似于单变量情况,多变量函数的局部极值点也必然是临界点。为了分类这些临界点,我们使用二阶偏导数构成的{{{海森矩阵 (Hessian Matrix)}}}。对于二元函数 $f(x, y)$,其海森矩阵为: $$ H_f(x, y) = \begin{pmatrix} f_{xx} & f_{xy} \\ f_{yx} & f_{yy} \end{pmatrix} $$ 其中 $f_{xx} = \frac{\partial^2 f}{\partial x^2}$, $f_{xy} = \frac{\partial^2 f}{\partial x \partial y}$,依此类推。

在临界点 $(a, b)$ 处,通过计算海森矩阵的行列式 $D = f_{xx}f_{yy} - (f_{xy})^2$ 的值: * 若 $D > 0$ 且 $f_{xx}(a, b) > 0$,则 $(a, b)$ 是一个{{{局部极小值}}}点。 * 若 $D > 0$ 且 $f_{xx}(a, b) < 0$,则 $(a, b)$ 是一个{{{局部极大值}}}点。 * 若 $D < 0$,则 $(a, b)$ 是一个{{{鞍点 (Saddle Point)}}},即该点在某个方向上是极大值,在另一个方向上是极小值,因此不是极值点。 * 若 $D = 0$,则此判别法失效。

## 经济学应用

在经济学和金融学中,寻找临界点是求解无约束优化问题的核心步骤。

* 利润最大化:一个企业的目标是最大化其{{{利润函数}}} $\Pi(q) = R(q) - C(q)$,其中 $R(q)$ 是{{{总收益}}}, $C(q)$ 是{{{总成本}}},$q$ 是产量。为了找到最优产量,企业需要求解一阶条件 $\Pi'(q) = 0$,即{{{边际收益}}} $MR(q) = R'(q)$ 等于{{{边际成本}}} $MC(q) = C'(q)$ 的点。这个点便是一个临界点。之后通过二阶条件 $\Pi''(q) < 0$ 来确认它是一个极大值点。

* 效用最大化:在{{{微观经济学}}}中,消费者在{{{预算约束}}}下最大化其{{{效用函数}}}。虽然这是一个{{{约束最优化}}}问题,但通过构造{{{拉格朗日函数}}},问题被转化为寻找该拉格朗日函数的临界点。

* 投资组合理论:在金融学中,投资者希望构建一个资产组合来在给定{{{风险}}}水平下最大化{{{期望收益}}},或者在给定期望收益下最小化风险(通常用{{{方差}}}度量)。这本质上是一个多变量优化问题,其解同样是通过求解相应的临界点得到的。