ARTICLE

驻点

驻点 (Stationary Point) 驻点 (Stationary Point),亦称平稳点,是 微积分学 与 数学分析 中关于 可微函数 的一个核心概念。对于实值函数,驻点指导数为零的点;从几何直观来看,这意味着函数图像在该点处的 切线 是水平的。寻找驻点是确定函数 极值 —— 即 局部极大值 (Local Maximum) 与 局部极小值 (Loc

浏览 46 更新 2025-10-29

驻点 (Stationary Point)

驻点 (Stationary Point),亦称平稳点,是 微积分学数学分析 中关于 可微函数 的一个核心概念。对于实值函数,驻点指导数为零的点;从几何直观来看,这意味着函数图像在该点处的 切线 是水平的。寻找驻点是确定函数 极值 —— 即 局部极大值 (Local Maximum) 与 局部极小值 (Local Minimum) —— 的第一步,也是求解最优化问题的关键环节,在 经济学金融学统计学 及工程学中具有广泛而基础的应用。

定义

单变量函数

对于单变量可微函数 f(x)f(x),若点 x0x_0 满足

f(x0)=dfdxx=x0=0f'(x_0) = \frac{df}{dx}\bigg|_{x=x_0} = 0

则称 x0x_0f(x)f(x) 的一个 驻点。在函数图像上,点 (x0,f(x0))(x_0, f(x_0)) 亦称为驻点。这一条件意味着函数在 x0x_0 处的瞬时变化率为零,函数图像在该点附近处于"平缓"状态。

多变量函数

对于多变量可微函数 f(x1,x2,,xn)f(x_1, x_2, \ldots, x_n),若点 x0=(x1,0,x2,0,,xn,0)\mathbf{x}_0 = (x_{1,0}, x_{2,0}, \ldots, x_{n,0}) 满足其 梯度 为零向量,即

f(x0)=0\nabla f(\mathbf{x}_0) = \mathbf{0}

x0\mathbf{x}_0 为驻点。梯度为零等价于函数在该点处所有方向的方向导数均为零,也就是说所有 偏导数 同时为零:

fx1(x0)=0,fx2(x0)=0,,fxn(x0)=0\frac{\partial f}{\partial x_1}(\mathbf{x}_0) = 0, \quad \frac{\partial f}{\partial x_2}(\mathbf{x}_0) = 0, \quad \ldots, \quad \frac{\partial f}{\partial x_n}(\mathbf{x}_0) = 0

驻点的分类

导数为零本身并不揭示函数在该点处的真实形态——它可能是峰顶、谷底,也可能是鞍部或平坦的拐点。要确定驻点的性质,需依据函数在驻点邻域内的行为进行分类。驻点主要有三种类型:

  1. 局部极大值 (Local Maximum):函数在该点的值大于或等于其邻近所有点的值。函数图像在经过此点时,从 增函数(一阶导数为正)转变为 减函数(一阶导数为负)。
  2. 局部极小值 (Local Minimum):函数在该点的值小于或等于其邻近所有点的值。函数在经过此点时,从减函数转变为增函数。
  3. 鞍点 (Saddle Point):该点为驻点,但既不是局部极大值也不是局部极小值。对于单变量函数,鞍点通常表现为 水平拐点 (Horizontal Inflection Point)——函数在经过此点前后同为增函数或同为减函数,仅切线水平。经典实例为 f(x)=x3f(x) = x^3x=0x = 0 处的行为。对于多变量函数,鞍点意味着沿某一方向为极大值,沿另一方向为极小值,函数曲面形状如同马鞍。

判断驻点类型的检验方法

求得驻点(即求解方程 f(x)=0f'(\mathbf{x}) = 0f(x)=0\nabla f(\mathbf{x}) = \mathbf{0})之后,需用进一步的分析方法判别其类型。

一阶导数检验 (First Derivative Test)

此方法主要用于单变量函数,核心思想是考察驻点 x0x_0 左右两侧一阶导数 f(x)f'(x) 的符号变化:

  • f(x)f'(x)x0x_0 左侧为正、右侧为负,则 f(x0)f(x_0)局部极大值
  • f(x)f'(x)x0x_0 左侧为负、右侧为正,则 f(x0)f(x_0)局部极小值
  • f(x)f'(x)x0x_0 两侧符号不变(同为正或同为负),则 x0x_0水平拐点。例如,对于 f(x)=x3f(x) = x^3,有 f(x)=3x2f'(x) = 3x^2,驻点为 x0=0x_0 = 0;在 x=0x = 0 左侧 f(1)=3>0f'(-1) = 3 > 0,右侧 f(1)=3>0f'(1) = 3 > 0,符号未变,故 (0,0)(0, 0) 为水平拐点。

二阶导数检验 (Second Derivative Test)

该方法利用 二阶导数 判断函数在驻点处的 凹凸性,从而直接确定极值类型。

对于单变量函数,在驻点 x0x_0 处:

  • f(x0)>0f''(x_0) > 0,函数在该点 凹向上 (Concave Up),故 f(x0)f(x_0)局部极小值。典型例子:f(x)=x2f(x) = x^2f(0)=2>0f''(0) = 2 > 0(0,0)(0, 0) 为极小值。
  • f(x0)<0f''(x_0) < 0,函数在该点 凹向下 (Concave Down),故 f(x0)f(x_0)局部极大值。典型例子:f(x)=x2f(x) = -x^2f(0)=2<0f''(0) = -2 < 0(0,0)(0, 0) 为极大值。
  • f(x0)=0f''(x_0) = 0,则二阶导数检验 无效 (Inconclusive),需退回使用一阶导数检验或更高阶导数检验。例如 f(x)=x4f(x) = x^4f(x)=x3f(x) = x^3x=0x = 0 处均有 f(0)=0f''(0) = 0,但前者为极小值,后者为拐点。

对于多变量函数(以二元函数为例),需构造 Hesse矩阵 进行判断。在驻点 (x0,y0)(x_0, y_0) 处,Hesse 矩阵为:

H(x0,y0)=(fxx(x0,y0)fxy(x0,y0)fyx(x0,y0)fyy(x0,y0))H(x_0, y_0) = \begin{pmatrix} f_{xx}(x_0, y_0) & f_{xy}(x_0, y_0) \\ f_{yx}(x_0, y_0) & f_{yy}(x_0, y_0) \end{pmatrix}

其中 fxx,fxy,fyyf_{xx}, f_{xy}, f_{yy} 为二阶偏导数。根据 克莱罗定理,当二阶偏导数连续时,混合偏导数相等:fxy=fyxf_{xy} = f_{yx}。令 D=det(H)=fxxfyy(fxy)2D = \det(H) = f_{xx}f_{yy} - (f_{xy})^2 为 Hesse 矩阵的 行列式,判别规则如下:

  • D>0D > 0fxx(x0,y0)>0f_{xx}(x_0, y_0) > 0 \Rightarrow (x0,y0)(x_0, y_0)局部极小值
  • D>0D > 0fxx(x0,y0)<0f_{xx}(x_0, y_0) < 0 \Rightarrow (x0,y0)(x_0, y_0)局部极大值
  • D<0D < 0 \Rightarrow (x0,y0)(x_0, y_0)鞍点
  • D=0D = 0 \Rightarrow 检验 无效,需借助更高阶的分析方法。

与其他概念的关系

驻点与临界点:驻点是 临界点 (Critical Point) 的一种。临界点指导数为零或导数 不存在 的点。因此,所有驻点都是临界点,但反之未必成立。例如,函数 f(x)=xf(x) = |x|x=0x = 0 处导数不存在,故 x=0x = 0 是临界点,但不是驻点。

局部极值与全局极值:驻点给出的是局部极值,而非全局性质。函数在给定 定义域 上的 全局极大值全局极小值 (Global Extremum) 可能出现在驻点处,也可能出现在定义域的边界上。因此,在求解全局最优化问题时,必须同时比较所有驻点处的函数值与所有边界点处的函数值。

应用

寻找驻点是求解无约束最优化问题的核心步骤,在各学科中有广泛应用。

微观经济学 中,企业追求 利润 最大化。利润函数 Π(q)=R(q)C(q)\Pi(q) = R(q) - C(q)(其中 RR总收入CC总成本qq 为产量)的驻点条件 Π(q)=R(q)C(q)=0\Pi'(q) = R'(q) - C'(q) = 0 给出 边际收入 等于 边际成本MR=MCMR = MC),这是确定最优产量的经典一阶条件。类似地,消费者在 预算约束 下最大化 效用函数 时,通常借助 拉格朗日乘数法 构造拉格朗日函数并求解驻点来得到最优消费组合。

统计学计量经济学 中,最大似然估计 (MLE) 通过求解 似然函数(或对数似然函数)的驻点来获得参数的渐近有效估计。具体而言,给定样本的联合密度,对数似然函数对参数向量求偏导并置零,得到一组估计方程(estimating equations),其解即为最大似然估计量。普通最小二乘法 (OLS) 同样遵循这一逻辑——通过最小化 残差平方和 对各回归系数求偏导并令其为零,得到正规方程组 (normal equations),本质上也是在求解一个二次型函数的驻点。此外,在 数值优化 领域,梯度下降法牛顿法 等算法均以寻找目标函数的驻点(或梯度为零的点)为迭代目标,构成了现代机器学习与统计计算的算法基础。