ARTICLE

偏导数

偏导数(Partial Derivative)是微积分中一个核心概念,它将单变量函数的导数思想推广到多元函数。对于一个含有多个自变量的函数,偏导数衡量的是当只有一个自变量发生变化,而其他所有自变量都保持不变时,因变量的变化率。 1. 核心思想与定义 偏导数与普通导数一脉相承,却解决了一个更复杂的问题:当一个函数的取值由多个因素共同决定时,如何孤立地研究单一因

浏览 38 更新 2025-10-26

偏导数(Partial Derivative)是微积分中一个核心概念,它将单变量函数的导数思想推广到多元函数。对于一个含有多个自变量的函数,偏导数衡量的是当只有一个自变量发生变化,而其他所有自变量都保持不变时,因变量的变化率。

1. 核心思想与定义

偏导数与普通导数一脉相承,却解决了一个更复杂的问题:当一个函数的取值由多个因素共同决定时,如何孤立地研究单一因素的影响。在单变量微积分中,导数 f(x) f'(x) 描述了函数 f(x) f(x) 在点 x x 处的瞬时变化率。然而,当一个函数依赖于多个变量时,例如 f(x,y) f(x, y) ,其值的变化可以由 x x 的变化引起,也可以由 y y 的变化引起,或者由两者同时变化引起。

偏导数的精髓在于"控制变量"。为了研究函数值随某一个特定变量(如 x x )的变化情况,我们暂时将所有其他变量(如 y y )视为常数,然后对这个"伪"单变量函数求导,结果就是函数 f f 关于变量 x x 的偏导数。

符号表示

函数 z=f(x,y,) z = f(x, y, \dots) 关于自变量 x x 的偏导数有以下几种常见的表示方法:

  • zx \frac{\partial z}{\partial x} fx \frac{\partial f}{\partial x} (莱布尼茨表示法)
  • fx(x,y,) f_x(x, y, \dots) Dxf D_x f (欧拉表示法)

符号 \partial (圆体d)用于明确区别于单变量导数中使用的符号 d d

形式化定义

函数 f(x1,x2,,xn) f(x_1, x_2, \dots, x_n) 在点 (a1,a2,,an) (a_1, a_2, \dots, a_n) 关于变量 xi x_i 的偏导数被定义为一个极限:

fxi(a1,,an)=limh0f(a1,,ai+h,,an)f(a1,,ai,,an)h\frac{\partial f}{\partial x_i}(a_1, \dots, a_n) = \lim_{h \to 0} \frac{f(a_1, \dots, a_i+h, \dots, a_n) - f(a_1, \dots, a_i, \dots, a_n)}{h}

这个定义直观地展示了计算过程:在函数中,只让第 i i 个自变量增加一个微小的量 h h ,而其他所有自变量都固定在它们的初始值 aj a_j ji j \neq i ),然后计算函数增量与自变量增量之比的极限。

2. 计算方法

在实际计算中,我们不需要每次都通过极限来求解。计算偏导数的法则是:将除目标变量外的所有其他自变量都视为常数,然后按照单变量函数的求导法则进行计算。

示例 1: 假设函数 f(x,y)=3x2y4+5xy2 f(x, y) = 3x^2y^4 + 5x - y^2

求关于 x x 的偏导数 fx f_x :将 y y 视为常数,y4 y^4 y2 y^2 也都是常数。

fx=x(3x2y4+5xy2)=(3y4)(2x)+50=6xy4+5\frac{\partial f}{\partial x} = \frac{\partial}{\partial x} (3x^2y^4 + 5x - y^2) = (3y^4)(2x) + 5 - 0 = 6xy^4 + 5

求关于 y y 的偏导数 fy f_y :将 x x 视为常数,3x2 3x^2 5x 5x 也都是常数。

fy=y(3x2y4+5xy2)=(3x2)(4y3)+02y=12x2y32y\frac{\partial f}{\partial y} = \frac{\partial}{\partial y} (3x^2y^4 + 5x - y^2) = (3x^2)(4y^3) + 0 - 2y = 12x^2y^3 - 2y

示例 2: 考虑柯布—道格拉斯生产函数 Q(K,L)=AKαLβ Q(K, L) = A K^\alpha L^\beta ,其中 A A 为全要素生产率,K K 为资本,L L 为劳动。关于劳动的偏导数为:

QL=AKαβLβ1=βQL\frac{\partial Q}{\partial L} = A K^\alpha \cdot \beta L^{\beta-1} = \beta \cdot \frac{Q}{L}

这恰好是劳动的边际产出——每增加一单位劳动所带来的额外产出,是经济学中边际分析的经典应用之一。

3. 几何解释

偏导数的几何意义对于理解其本质至关重要。对于二元函数 z=f(x,y) z = f(x, y) ,其图像是三维空间中的一个曲面。

偏导数 fx(a,b) \frac{\partial f}{\partial x}(a, b) 的几何意义是:用一个垂直于 xy xy 平面的平面 y=b y = b 去切割曲面 z=f(x,y) z = f(x, y) ,得到一条曲线 g(x)=f(x,b) g(x) = f(x, b) ,而偏导数正是这条曲线在点 (a,b,f(a,b)) (a, b, f(a,b)) 处切线的斜率,描述了沿平行于 x x 轴方向移动时曲面高度的变化快慢。

同理,fy(a,b) \frac{\partial f}{\partial y}(a, b) 是曲面与平面 x=a x = a 相交所得曲线在同一点处的切线斜率,描述了沿平行于 y y 轴方向移动时曲面高度的变化率。这两个偏导数共同定义了曲面在该点处的切平面,这对于函数的线性近似至关重要。

4. 高阶偏导数

由于偏导数本身也是一个多元函数,我们可以继续对其求偏导,从而得到高阶偏导数。对于二元函数 f(x,y) f(x, y) ,有四种二阶偏导数:

  • fxx=x(fx)=2fx2 f_{xx} = \frac{\partial}{\partial x}(\frac{\partial f}{\partial x}) = \frac{\partial^2 f}{\partial x^2} (对 x x 求两次偏导)
  • fyy=y(fy)=2fy2 f_{yy} = \frac{\partial}{\partial y}(\frac{\partial f}{\partial y}) = \frac{\partial^2 f}{\partial y^2} (对 y y 求两次偏导)
  • fyx=x(fy)=2fxy f_{yx} = \frac{\partial}{\partial x}(\frac{\partial f}{\partial y}) = \frac{\partial^2 f}{\partial x \partial y} (先对 y y 再对 x x 求偏导)
  • fxy=y(fx)=2fyx f_{xy} = \frac{\partial}{\partial y}(\frac{\partial f}{\partial x}) = \frac{\partial^2 f}{\partial y \partial x} (先对 x x 再对 y y 求偏导)

fxy f_{xy} fyx f_{yx} 被称为混合偏导数克莱罗定理指出:如果函数 f(x,y) f(x,y) 的二阶混合偏导数 fxy f_{xy} fyx f_{yx} 在某一点的邻域内存在且连续,那么在该点它们必然相等——fxy=fyx f_{xy} = f_{yx} 。这意味着在大多数"表现良好"的函数中,求导次序是可以交换的。

5. 偏导数在经济学与金融学中的应用

偏导数是构建和分析现代经济模型与金融模型的基础工具。

边际分析: 经济学中的"边际"概念通常由偏导数来量化。在效用函数 U(x1,x2) U(x_1, x_2) 中,Ux1 \frac{\partial U}{\partial x_1} 表示在保持商品 x2 x_2 消费量不变的情况下,增加一单位商品 x1 x_1 消费所带来的额外效用——即商品1的边际效用。在生产函数 Q(K,L) Q(K, L) 中,QL \frac{\partial Q}{\partial L} 是劳动的边际产量。

最优化问题: 无论是消费者寻求效用最大化,还是企业追求利润最大化,都涉及多元函数的极值问题。求解这些问题的必要条件(一阶条件)是函数对所有自变量的一阶偏导数都为零:fx1=0,fx2=0, \frac{\partial f}{\partial x_1} = 0, \frac{\partial f}{\partial x_2} = 0, \dots 。结合二阶条件(由二阶偏导数构成的海森矩阵),可以判断极值的类型。拉格朗日乘数法也是建立在偏导数基础之上的约束最优化方法。

金融工程: 在风险管理中,交易员使用一系列被称为"Greeks"的风险度量指标,这些指标本质上是期权价格对其各个参数的偏导数。例如,Delta(Δ=VS \Delta = \frac{\partial V}{\partial S} )度量期权价格对标的资产价格的敏感度,Gamma(Γ=2VS2 \Gamma = \frac{\partial^2 V}{\partial S^2} )度量Delta对标的资产价格的变化率。

6. 延伸概念

偏导数是理解更高级概念的基石。梯度是一个向量,由函数在某一点的所有偏导数构成(f=(fx1,fx2,) \nabla f = (\frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \dots) ),指向函数值增长最快的方向。方向导数衡量函数沿任意指定方向的变化率,可通过梯度与方向向量的点积计算。全微分 df df 则用于近似当所有自变量都发生微小变化时函数值的总变化量:df=fxdx+fydy+ df = \frac{\partial f}{\partial x}dx + \frac{\partial f}{\partial y}dy + \dots 。这些概念共同构成了多元微积分分析的理论框架,在机器学习中的梯度下降算法、物理学中的场论以及工程优化领域均有广泛应用。