驻点 (Stationary Point)
驻点 (Stationary Point),亦称平稳点,是 微积分学 与 数学分析 中关于 可微函数 的一个核心概念。对于实值函数,驻点指导数为零的点;从几何直观来看,这意味着函数图像在该点处的 切线 是水平的。寻找驻点是确定函数 极值 —— 即 局部极大值 (Local Maximum) 与 局部极小值 (Local Minimum) —— 的第一步,也是求解最优化问题的关键环节,在 经济学、金融学、统计学 及工程学中具有广泛而基础的应用。
定义
单变量函数
对于单变量可微函数 f(x),若点 x0 满足
f′(x0)=dxdfx=x0=0
则称 x0 为 f(x) 的一个 驻点。在函数图像上,点 (x0,f(x0)) 亦称为驻点。这一条件意味着函数在 x0 处的瞬时变化率为零,函数图像在该点附近处于"平缓"状态。
多变量函数
对于多变量可微函数 f(x1,x2,…,xn),若点 x0=(x1,0,x2,0,…,xn,0) 满足其 梯度 为零向量,即
∇f(x0)=0
则 x0 为驻点。梯度为零等价于函数在该点处所有方向的方向导数均为零,也就是说所有 偏导数 同时为零:
∂x1∂f(x0)=0,∂x2∂f(x0)=0,…,∂xn∂f(x0)=0
驻点的分类
导数为零本身并不揭示函数在该点处的真实形态——它可能是峰顶、谷底,也可能是鞍部或平坦的拐点。要确定驻点的性质,需依据函数在驻点邻域内的行为进行分类。驻点主要有三种类型:
- 局部极大值 (Local Maximum):函数在该点的值大于或等于其邻近所有点的值。函数图像在经过此点时,从 增函数(一阶导数为正)转变为 减函数(一阶导数为负)。
- 局部极小值 (Local Minimum):函数在该点的值小于或等于其邻近所有点的值。函数在经过此点时,从减函数转变为增函数。
- 鞍点 (Saddle Point):该点为驻点,但既不是局部极大值也不是局部极小值。对于单变量函数,鞍点通常表现为 水平拐点 (Horizontal Inflection Point)——函数在经过此点前后同为增函数或同为减函数,仅切线水平。经典实例为 f(x)=x3 在 x=0 处的行为。对于多变量函数,鞍点意味着沿某一方向为极大值,沿另一方向为极小值,函数曲面形状如同马鞍。
判断驻点类型的检验方法
求得驻点(即求解方程 f′(x)=0 或 ∇f(x)=0)之后,需用进一步的分析方法判别其类型。
一阶导数检验 (First Derivative Test)
此方法主要用于单变量函数,核心思想是考察驻点 x0 左右两侧一阶导数 f′(x) 的符号变化:
- 若 f′(x) 在 x0 左侧为正、右侧为负,则 f(x0) 为 局部极大值。
- 若 f′(x) 在 x0 左侧为负、右侧为正,则 f(x0) 为 局部极小值。
- 若 f′(x) 在 x0 两侧符号不变(同为正或同为负),则 x0 为 水平拐点。例如,对于 f(x)=x3,有 f′(x)=3x2,驻点为 x0=0;在 x=0 左侧 f′(−1)=3>0,右侧 f′(1)=3>0,符号未变,故 (0,0) 为水平拐点。
二阶导数检验 (Second Derivative Test)
该方法利用 二阶导数 判断函数在驻点处的 凹凸性,从而直接确定极值类型。
对于单变量函数,在驻点 x0 处:
- 若 f′′(x0)>0,函数在该点 凹向上 (Concave Up),故 f(x0) 为 局部极小值。典型例子:f(x)=x2,f′′(0)=2>0,(0,0) 为极小值。
- 若 f′′(x0)<0,函数在该点 凹向下 (Concave Down),故 f(x0) 为 局部极大值。典型例子:f(x)=−x2,f′′(0)=−2<0,(0,0) 为极大值。
- 若 f′′(x0)=0,则二阶导数检验 无效 (Inconclusive),需退回使用一阶导数检验或更高阶导数检验。例如 f(x)=x4 与 f(x)=x3 在 x=0 处均有 f′′(0)=0,但前者为极小值,后者为拐点。
对于多变量函数(以二元函数为例),需构造 Hesse矩阵 进行判断。在驻点 (x0,y0) 处,Hesse 矩阵为:
H(x0,y0)=(fxx(x0,y0)fyx(x0,y0)fxy(x0,y0)fyy(x0,y0))
其中 fxx,fxy,fyy 为二阶偏导数。根据 克莱罗定理,当二阶偏导数连续时,混合偏导数相等:fxy=fyx。令 D=det(H)=fxxfyy−(fxy)2 为 Hesse 矩阵的 行列式,判别规则如下:
- D>0 且 fxx(x0,y0)>0 ⇒ (x0,y0) 为 局部极小值。
- D>0 且 fxx(x0,y0)<0 ⇒ (x0,y0) 为 局部极大值。
- D<0 ⇒ (x0,y0) 为 鞍点。
- D=0 ⇒ 检验 无效,需借助更高阶的分析方法。
与其他概念的关系
驻点与临界点:驻点是 临界点 (Critical Point) 的一种。临界点指导数为零或导数 不存在 的点。因此,所有驻点都是临界点,但反之未必成立。例如,函数 f(x)=∣x∣ 在 x=0 处导数不存在,故 x=0 是临界点,但不是驻点。
局部极值与全局极值:驻点给出的是局部极值,而非全局性质。函数在给定 定义域 上的 全局极大值 或 全局极小值 (Global Extremum) 可能出现在驻点处,也可能出现在定义域的边界上。因此,在求解全局最优化问题时,必须同时比较所有驻点处的函数值与所有边界点处的函数值。
应用
寻找驻点是求解无约束最优化问题的核心步骤,在各学科中有广泛应用。
在 微观经济学 中,企业追求 利润 最大化。利润函数 Π(q)=R(q)−C(q)(其中 R 为 总收入,C 为 总成本,q 为产量)的驻点条件 Π′(q)=R′(q)−C′(q)=0 给出 边际收入 等于 边际成本(MR=MC),这是确定最优产量的经典一阶条件。类似地,消费者在 预算约束 下最大化 效用函数 时,通常借助 拉格朗日乘数法 构造拉格朗日函数并求解驻点来得到最优消费组合。
在 统计学 与 计量经济学 中,最大似然估计 (MLE) 通过求解 似然函数(或对数似然函数)的驻点来获得参数的渐近有效估计。具体而言,给定样本的联合密度,对数似然函数对参数向量求偏导并置零,得到一组估计方程(estimating equations),其解即为最大似然估计量。普通最小二乘法 (OLS) 同样遵循这一逻辑——通过最小化 残差平方和 对各回归系数求偏导并令其为零,得到正规方程组 (normal equations),本质上也是在求解一个二次型函数的驻点。此外,在 数值优化 领域,梯度下降法、牛顿法 等算法均以寻找目标函数的驻点(或梯度为零的点)为迭代目标,构成了现代机器学习与统计计算的算法基础。