梯度 (Gradient)
梯度 (Gradient) 是多元微积分 (Multivariable Calculus) 中的核心概念,描述了一个多变量标量场 (Scalar Field) 在某一点的变化率和变化方向。梯度是一个向量,指向函数在该点增长最快的方向,其大小(或模)表示最快增长率的值。梯度的标准记号是 ∇f,其中 ∇ (读作 nabla 或 del) 是向量微分算子。
数学定义
设有 n 个变量的实值函数 f(x1,x2,…,xn),在点 P 的所有偏导数都存在。函数 f 在 P 的梯度定义为 n 维向量,其分量为各偏导数:
∇f(x1,…,xn)=(∂x1∂f,∂x2∂f,…,∂xn∂f)
对三变量函数 f(x,y,z):∇f=(∂x∂f,∂y∂f,∂z∂f)=∂x∂fi+∂y∂fj+∂z∂fk。
几何与物理直观
方向:∇f 指向函数增长最快的方向。如站在山坡上,海拔函数 h(x,y) 的梯度指向最陡峭的上山路径。
大小:梯度向量的模 ∥∇f∥ 表示最陡峭方向上的变化率:
∥∇f∥=(∂x1∂f)2+⋯+(∂xn∂f)2
模大则函数变化剧烈(陡坡),模小则平缓。∇f=0 意味着该点是临界点(山峰、谷底或鞍点)。
示例
考虑 f(x,y)=x2+2y2,一个向上开口的椭圆抛物面。∂x∂f=2x,∂y∂f=4y,故 ∇f(x,y)=(2x,4y)。在 P(1,1):∇f=(2,4),最快增长率为 ∥∇f∥=20。在原点 (0,0),∇f=(0,0),为最低点。
重要性质
梯度与方向导数:方向导数 Duf 衡量沿单位向量 u 的变化率:Duf=∇f⋅u=∥∇f∥cosθ。当 θ=0(同向),方向导数取最大值 ∥∇f∥,数学上证明梯度方向即最快增长方向。
梯度与等高线:函数在某点的梯度向量垂直(正交)于经过该点的等高线。沿等高线方向 t,Dtf=∇f⋅t=0,故梯度必与切线垂直。
负梯度方向:−∇f 是函数下降最快的方向,如同山坡上最陡峭的下山路。这是梯度下降法等优化算法的理论基石。
在经济、金融与统计中的应用
经济学最优化:消费者最大化效用函数、生产者最大化利润函数或最小化成本函数,均可建模为多变量函数寻优。求解 ∇f=0 是找到临界点的标准第一步。
统计学与机器学习:训练模型时需最小化损失函数。梯度下降法沿负梯度方向迭代更新参数,逐步逼近局部最小值。随机梯度下降 (SGD) 是其高效变体,为深度学习的基石算法。
计量经济学:最大似然估计 (MLE) 中,当似然函数无解析解时,须用基于梯度的数值优化算法(如牛顿法、拟牛顿法)求解最优参数。