ARTICLE

梯度

梯度 (Gradient) 梯度 (Gradient) 是多元微积分 (Multivariable Calculus) 中的核心概念,描述了一个多变量标量场 (Scalar Field) 在某一点的变化率和变化方向。梯度是一个向量,指向函数在该点增长最快的方向,其大小(或模)表示最快增长率的值。梯度的标准记号是 f,其中 (读作 nabla 或 del) 是

浏览 51 更新 2025-10-26

梯度 (Gradient)

梯度 (Gradient)多元微积分 (Multivariable Calculus) 中的核心概念,描述了一个多变量标量场 (Scalar Field) 在某一点的变化率和变化方向。梯度是一个向量,指向函数在该点增长最快的方向,其大小(或模)表示最快增长率的值。梯度的标准记号是 f\nabla f,其中 \nabla (读作 nabla 或 del) 是向量微分算子。

数学定义

设有 nn 个变量的实值函数 f(x1,x2,,xn)f(x_1, x_2, \dots, x_n),在点 PP 的所有偏导数都存在。函数 ffPP 的梯度定义为 nn 维向量,其分量为各偏导数:

f(x1,,xn)=(fx1,fx2,,fxn)\nabla f(x_1, \dots, x_n) = \left( \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \dots, \frac{\partial f}{\partial x_n} \right)

对三变量函数 f(x,y,z)f(x, y, z)f=(fx,fy,fz)=fxi+fyj+fzk\nabla f = \left( \frac{\partial f}{\partial x}, \frac{\partial f}{\partial y}, \frac{\partial f}{\partial z} \right) = \frac{\partial f}{\partial x}\mathbf{i} + \frac{\partial f}{\partial y}\mathbf{j} + \frac{\partial f}{\partial z}\mathbf{k}

几何与物理直观

方向f\nabla f 指向函数增长最快的方向。如站在山坡上,海拔函数 h(x,y)h(x, y) 的梯度指向最陡峭的上山路径。

大小:梯度向量的 f\|\nabla f\| 表示最陡峭方向上的变化率:

f=(fx1)2++(fxn)2\|\nabla f\| = \sqrt{\left(\frac{\partial f}{\partial x_1}\right)^2 + \dots + \left(\frac{\partial f}{\partial x_n}\right)^2}

模大则函数变化剧烈(陡坡),模小则平缓。f=0\nabla f = \mathbf{0} 意味着该点是临界点(山峰、谷底或鞍点)。

示例

考虑 f(x,y)=x2+2y2f(x, y) = x^2 + 2y^2,一个向上开口的椭圆抛物面。fx=2x\frac{\partial f}{\partial x} = 2xfy=4y\frac{\partial f}{\partial y} = 4y,故 f(x,y)=(2x,4y)\nabla f(x, y) = (2x, 4y)。在 P(1,1)P(1, 1)f=(2,4)\nabla f = (2, 4),最快增长率为 f=20\|\nabla f\| = \sqrt{20}。在原点 (0,0)(0, 0)f=(0,0)\nabla f = (0, 0),为最低点。

重要性质

梯度与方向导数方向导数 DufD_{\mathbf{u}}f 衡量沿单位向量 u\mathbf{u} 的变化率:Duf=fu=fcosθD_{\mathbf{u}}f = \nabla f \cdot \mathbf{u} = \|\nabla f\| \cos\theta。当 θ=0\theta = 0(同向),方向导数取最大值 f\|\nabla f\|,数学上证明梯度方向即最快增长方向。

梯度与等高线:函数在某点的梯度向量垂直(正交)于经过该点的等高线。沿等高线方向 t\mathbf{t}Dtf=ft=0D_{\mathbf{t}}f = \nabla f \cdot \mathbf{t} = 0,故梯度必与切线垂直。

负梯度方向f-\nabla f 是函数下降最快的方向,如同山坡上最陡峭的下山路。这是梯度下降法优化算法的理论基石。

在经济、金融与统计中的应用

经济学最优化:消费者最大化效用函数、生产者最大化利润函数或最小化成本函数,均可建模为多变量函数寻优。求解 f=0\nabla f = \mathbf{0} 是找到临界点的标准第一步。

统计学与机器学习:训练模型时需最小化损失函数梯度下降法沿负梯度方向迭代更新参数,逐步逼近局部最小值。随机梯度下降 (SGD) 是其高效变体,为深度学习的基石算法。

计量经济学最大似然估计 (MLE) 中,当似然函数无解析解时,须用基于梯度的数值优化算法(如牛顿法、拟牛顿法)求解最优参数。