ARTICLE

全微分

全微分 全微分(total differential)是多元函数微分学中的核心概念,它将一元函数中微分的概念推广到多元情形。简单来说,全微分描述了当函数的多个自变量同时发生微小变化时,函数值的变化量如何被近似表示为各个自变量变化的线性组合。这一思想在数学分析、物理学、经济学以及工程技术的各个领域中都有着极其广泛的应用。理解全微分是掌握多元微积分的关键一步,它

浏览 4 更新 2025-10-26

全微分

全微分(total differential)是多元函数微分学中的核心概念,它将一元函数中微分的概念推广到多元情形。简单来说,全微分描述了当函数的多个自变量同时发生微小变化时,函数值的变化量如何被近似表示为各个自变量变化的线性组合。这一思想在数学分析、物理学、经济学以及工程技术的各个领域中都有着极其广泛的应用。理解全微分是掌握多元微积分的关键一步,它与偏导数、方向导数、梯度等概念密切相关,共同构成了多元微分学的理论体系。

定义

设二元函数 z=f(x,y) z = f(x, y) 在点 (x0,y0) (x_0, y_0) 的某个邻域内有定义。如果函数在点 (x0,y0) (x_0, y_0) 处的全增量

Δz=f(x0+Δx,y0+Δy)f(x0,y0)\Delta z = f(x_0 + \Delta x, y_0 + \Delta y) - f(x_0, y_0)

可以表示为

Δz=AΔx+BΔy+o(ρ)\Delta z = A\Delta x + B\Delta y + o(\rho)

其中 A A B B 是与 Δx \Delta x Δy \Delta y 无关的常数,ρ=(Δx)2+(Δy)2 \rho = \sqrt{(\Delta x)^2 + (\Delta y)^2} ,而 o(ρ) o(\rho) 是当 ρ0 \rho \to 0 时比 ρ \rho 高阶的无穷小,则称函数 z=f(x,y) z = f(x, y) 在点 (x0,y0) (x_0, y_0) 可微,并称 AΔx+BΔy A\Delta x + B\Delta y 为函数在点 (x0,y0) (x_0, y_0) 处的全微分,记作

dz=AΔx+BΔydz = A\Delta x + B\Delta y

进一步可以证明,如果函数可微,则 A=fx(x0,y0) A = f_x(x_0, y_0) (即对 x x 的偏导数),B=fy(x0,y0) B = f_y(x_0, y_0) (即对 y y 的偏导数)。因此全微分通常写作

dz=zxdx+zydydz = \frac{\partial z}{\partial x}dx + \frac{\partial z}{\partial y}dy

其中 dx=Δx dx = \Delta x dy=Δy dy = \Delta y 是自变量的微分。这个公式直观地表明:函数值的变化近似等于各方向偏导数乘以各自变量变化量的总和。

几何意义

全微分的几何意义是切平面的增量。对于二元函数 z=f(x,y) z = f(x, y) ,其在点 (x0,y0) (x_0, y_0) 处的全微分 dz dz 表示切平面在 z z 方向上的增量。从几何上看,当 (Δx,Δy) (\Delta x, \Delta y) 很小时,曲面上点附近的曲面可以用切平面来近似代替,这就是"以直代曲"的思想在多元函数中的体现。具体而言,函数图像在点 (x0,y0,z0) (x_0, y_0, z_0) 处的切平面方程为

zz0=fx(x0,y0)(xx0)+fy(x0,y0)(yy0)z - z_0 = f_x(x_0, y_0)(x - x_0) + f_y(x_0, y_0)(y - y_0)

全微分 dz dz 正是当 x x y y 分别变化 dx dx dy dy 时,切平面上 z z 坐标的变化量。

可微的条件

关于可微性,有以下重要的判别条件:

  • 必要条件:如果函数 z=f(x,y) z = f(x, y) 在点 (x0,y0) (x_0, y_0) 处可微,则它在该点处连续,且偏导数 fx(x0,y0) f_x(x_0, y_0) fy(x0,y0) f_y(x_0, y_0) 都存在。
  • 充分条件:如果函数 z=f(x,y) z = f(x, y) 的偏导数 fx(x,y) f_x(x, y) fy(x,y) f_y(x, y) 在点 (x0,y0) (x_0, y_0) 的某个邻域内存在且在该点处连续,则函数在该点处可微。

需要特别注意的是,偏导数存在仅是函数可微的必要条件而非充分条件。存在偏导数存在但函数不可微的例子,例如函数

f(x,y)={xyx2+y2,(x,y)(0,0)0,(x,y)=(0,0)f(x, y) = \begin{cases} \frac{xy}{x^2 + y^2}, & (x, y) \neq (0, 0) \\ 0, & (x, y) = (0, 0) \end{cases}

(0,0) (0, 0) 处偏导数存在但不连续,实际上该函数在该点不可微。另一个典型例子是

f(x,y)={x2yx2+y2,(x,y)(0,0)0,(x,y)=(0,0)f(x, y) = \begin{cases} \frac{x^2 y}{x^2 + y^2}, & (x, y) \neq (0, 0) \\ 0, & (x, y) = (0, 0) \end{cases}

该函数在原点处沿任意方向的方向导数都存在,但函数在原点处不连续,因此不可微。这些例子说明,多元函数的可微性比一元函数复杂得多,仅仅偏导数存在远远不够。

全微分与连续性、偏导数的关系

在一元函数中,可导必连续,且可导与可微等价。但在多元函数中,关系更为复杂:

  • 可微一定连续,但连续不一定可微。
  • 可微一定偏导数存在,但偏导数存在不一定可微。
  • 偏导数连续一定可微,但可微不一定偏导数连续。

因此,多元函数可微性是一个比偏导数存在更强、比偏导数连续更弱的概念。这一层次关系是多元微分学中需要重点掌握的内容。

高阶全微分

如果函数 z=f(x,y) z = f(x, y) 具有二阶连续偏导数,则可以定义二阶全微分:

d2z=d(dz)=2zx2dx2+22zxydxdy+2zy2dy2d^2 z = d(dz) = \frac{\partial^2 z}{\partial x^2}dx^2 + 2\frac{\partial^2 z}{\partial x \partial y}dxdy + \frac{\partial^2 z}{\partial y^2}dy^2

类似地可以定义更高阶的全微分。高阶全微分在泰勒公式和极值问题中有重要应用。例如,判断多元函数的极值类型时,需要用到二阶全微分(即海森矩阵)的正定性或负定性。若在某驻点处 d2z>0 d^2 z > 0 (正定),则该点为极小值点;若 d2z<0 d^2 z < 0 (负定),则为极大值点;若 d2z d^2 z 不定,则为鞍点。

全微分与偏微分的关系

全微分是各个自变量偏微分的线性叠加。对于 n n 元函数 y=f(x1,x2,,xn) y = f(x_1, x_2, \dots, x_n) ,其全微分为

dy=fx1dx1+fx2dx2++fxndxndy = \frac{\partial f}{\partial x_1}dx_1 + \frac{\partial f}{\partial x_2}dx_2 + \cdots + \frac{\partial f}{\partial x_n}dx_n

这一形式体现了全微分的一阶微分形式不变性:无论 xi x_i 是自变量还是中间变量,上式都成立。这意味着在求复合函数的全微分时,可以像处理一元函数那样逐层微分,然后将中间变量的微分代入,最终结果与直接使用链式法则得到的结果一致。

应用

全微分在自然科学和工程技术中有广泛的应用。在经济学中,全微分用于分析多个经济变量同时微小变动时产出或效用的变化,例如柯布-道格拉斯生产函数 Q=AKαLβ Q = AK^\alpha L^\beta 的全微分 dQ=QKdK+QLdL dQ = \frac{\partial Q}{\partial K}dK + \frac{\partial Q}{\partial L}dL 可以衡量劳动和资本投入的边际贡献,从而指导企业优化资源配置。在物理学中,全微分用于描述状态函数的变化,如热力学中内能的全微分形式 dU=TdSPdV dU = TdS - PdV ,以及吉布斯自由能的全微分 dG=VdPSdT dG = VdP - SdT ,这些关系构成了热力学势函数理论的基础,也是推导麦克斯韦关系式的起点。在误差分析中,全微分用于估计多个测量误差对最终结果的综合影响,公式为 ΔyfxiΔxi \Delta y \approx \sum \left|\frac{\partial f}{\partial x_i}\right| \Delta x_i ,帮助实验人员评估测量精度和系统误差。在地球科学中,全微分用于分析气候变化中各个因素的贡献;在机器学习中,梯度下降法正是基于全微分的概念来更新模型参数。此外,全微分还是隐函数定理、拉格朗日乘数法、条件极值等更高级理论的基础工具。

总而言之,全微分是多元微分学的核心工具,它将复杂的高维变化问题简化为线性近似问题,为理论分析和实际计算提供了强有力的数学手段。掌握全微分不仅有助于理解多元函数的行为,还能为后续学习更深入的数学理论奠定坚实基础。