ARTICLE

临界点

临界点 (Critical Point) 临界点 (Critical Point) 是微积分和数学分析中的一个基本概念,尤其在研究函数性质和解决优化问题时至关重要。一个函数的临界点是指其定义域内,该函数的导数为零或导数不存在的点。这些点是函数可能取得局部极大值或局部极小值的"候选点"。临界点的研究构成了分析函数行为的基石,它使得我们能够系统性地寻找函数的极值

浏览 158 更新 2025-10-29

临界点 (Critical Point)

临界点 (Critical Point)微积分数学分析中的一个基本概念,尤其在研究函数性质和解决优化问题时至关重要。一个函数的临界点是指其定义域内,该函数的导数为零或导数不存在的点。这些点是函数可能取得局部极大值局部极小值的"候选点"。临界点的研究构成了分析函数行为的基石,它使得我们能够系统性地寻找函数的极值,这在经济学(如利润最大化成本最小化)、物理学(如寻找系统的稳定平衡点与相变现象)以及统计学(如最大似然估计的参数求解)等领域均有广泛应用。临界点概念也是机器学习梯度下降法寻找损失函数最小值的重要理论基础。

形式化定义

临界点的定义根据函数的变量数目有所不同,但核心思想一致。

单变量函数

对于一个定义在开区间 I I 上的实值函数 f(x) f(x) ,其定义域内的一个点 c c 被称为临界点,如果它满足以下两个条件之一:

  1. f(c)=0 f'(c) = 0 :函数在点 c c 的导数等于零。在几何上,这意味着函数在点 (c,f(c)) (c, f(c)) 处的切线是水平的。这类点也被称为驻点 (Stationary Point)
  2. f(c) f'(c) 不存在:函数在点 c c 的导数不存在。在几何上,这通常对应于函数图像上的一个尖点或角点。

示例1:导数为零的情况考虑函数 f(x)=x33x f(x) = x^3 - 3x ,其导数为 f(x)=3x23 f'(x) = 3x^2 - 3 。令 f(x)=0 f'(x) = 0 得到 3x23=0 3x^2 - 3 = 0 ,解得 x=1 x = 1 x=1 x = -1 。因此这两个点是该函数的临界点(均为驻点)。进一步通过二阶导数判别可知 f(1)=6<0 f''(-1) = -6 < 0 ,故 x=1 x=-1 是局部极大值点;f(1)=6>0 f''(1) = 6 > 0 ,故 x=1 x=1 是局部极小值点。

示例2:导数不存在的情况对于函数 f(x)=(x2)2/3 f(x) = (x-2)^{2/3} ,其导数为 f(x)=23(x2)1/3=23x23 f'(x) = \frac{2}{3}(x-2)^{-1/3} = \frac{2}{3\sqrt[3]{x-2}} 。当 x=2 x=2 时,分母为零,因此 f(2) f'(2) 不存在。所以 x=2 x=2 是一个临界点,在图像上表现为一个尖点,且该点是函数的局部极小值点。

临界点与极值

临界点之所以重要,是因为它们与函数的局部极值(局部最大值和局部最小值)密切相关。根据费马引理,如果函数 f f 在点 c c 处取得局部极值,并且 f(c) f'(c) 存在,那么必然有 f(c)=0 f'(c) = 0 。这一定理的启示是:一个可微函数的所有局部极值点必定是临界点。因此,要寻找一个函数的局部极值,只需在其临界点和定义域端点中搜索即可,这极大地简化了求解过程。

然而,需要特别注意的是,临界点不一定是极值点。例如,函数 f(x)=x3 f(x) = x^3 x=0 x=0 f(0)=0 f'(0)=0 ,所以 x=0 x=0 是一个临界点。但是 f(x) f(x) x=0 x=0 附近严格单调递增,该点并非极值点,而是一个拐点。因此,找到临界点之后还需要进一步判别其类型。常用的判别方法有以下两种。

一阶导数判别法

该方法通过考察临界点两侧导数的符号变化来判断极值类型。假设 c c 是函数 f f 的一个临界点:如果导数 f(x) f'(x) 在经过 c c 时由正变负,则 c c 局部极大值点;如果由负变正,则 c c 局部极小值点;如果符号不变,则 c c 不是极值点(如拐点)。这种方法直观且适用于所有临界点,包括导数不存在的点。

二阶导数判别法

对于驻点(f(c)=0 f'(c)=0 的临界点),二阶导数判别法更为快捷。假设 f f c c 附近存在二阶导数:若 f(c)>0 f''(c) > 0 ,则 c c 局部极小值点(函数在该点附近为凸函数,凹口向上);若 f(c)<0 f''(c) < 0 ,则 c c 局部极大值点(函数在该点附近为凹函数,凹口向下);若 f(c)=0 f''(c) = 0 ,则判别法失效,需使用一阶导数判别法或更高阶导数测试。

多变量函数的临界点

对于多变量函数 f(x1,x2,,xn) f(x_1, x_2, \ldots, x_n) ,一个点 c \mathbf{c} 被称为临界点,如果其梯度 f(c)=0 \nabla f(\mathbf{c}) = \mathbf{0} (即所有偏导数同时为零)或梯度不存在。梯度的定义为 f=(fx1,fx2,,fxn) \nabla f = \left(\frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \ldots, \frac{\partial f}{\partial x_n}\right) ,因此条件 f(c)=0 \nabla f(\mathbf{c}) = \mathbf{0} 意味着 fx1(c)=fx2(c)==fxn(c)=0 \frac{\partial f}{\partial x_1}(\mathbf{c}) = \frac{\partial f}{\partial x_2}(\mathbf{c}) = \cdots = \frac{\partial f}{\partial x_n}(\mathbf{c}) = 0 。在几何上,对于二元函数 f(x,y) f(x, y) ,这表示函数在临界点处的切平面是水平的。

为了分类这些临界点,我们使用由二阶偏导数构成的海森矩阵。对于二元函数 f(x,y) f(x, y) ,其海森矩阵为 Hf(x,y)=(fxxfxyfyxfyy) H_f(x, y) = \begin{pmatrix} f_{xx} & f_{xy} \\ f_{yx} & f_{yy} \end{pmatrix} 。在临界点 (a,b) (a, b) 处,计算行列式 D=fxxfyy(fxy)2 D = f_{xx}f_{yy} - (f_{xy})^2

  • D>0 D > 0 fxx>0 f_{xx} > 0 ,则 (a,b) (a, b) 局部极小值点(函数在该点附近凸向)。
  • D>0 D > 0 fxx<0 f_{xx} < 0 ,则 (a,b) (a, b) 局部极大值点(函数在该点附近凹向)。
  • D<0 D < 0 ,则 (a,b) (a, b) 是一个鞍点——在一个方向上是极大值,另一个方向上是极小值,因此不是真正的极值点。
  • D=0 D = 0 ,则判别法失效,需要更精细的分析。

经济学应用

在经济学和金融学中,寻找临界点是求解无约束优化问题的核心步骤,几乎所有涉及最优决策的问题都可以归结为寻找临界点。

利润最大化:企业的目标是最大化利润函数 Π(q)=R(q)C(q) \Pi(q) = R(q) - C(q) ,其中 R(q) R(q) 总收益C(q) C(q) 总成本q q 是产量。一阶条件 Π(q)=0 \Pi'(q) = 0 边际收益等于边际成本,其解就是利润函数的临界点。二阶条件 Π(q)<0 \Pi''(q) < 0 确认该点为极大值点。

效用最大化:微观经济学中,消费者在预算约束下最大化效用函数。虽然这是一个约束最优化问题,但通过构造拉格朗日函数 L=U(x,y)+λ(Ipxxpyy) L = U(x, y) + \lambda (I - p_x x - p_y y) ,问题被转化为寻找该拉格朗日函数的临界点(一阶条件),这是求解约束优化问题的标准方法。

投资组合理论:在金融学中,投资者需要在给定风险(通常用方差度量)下最大化期望收益,或在给定期望收益下最小化风险。这是一个多变量优化问题,其最优解(即有效前沿上的点)正是通过求解相应的临界点得到的,体现了临界点概念在金融决策中的核心地位。