全微分
全微分(total differential)是多元函数微分学中的核心概念,它将一元函数中微分的概念推广到多元情形。简单来说,全微分描述了当函数的多个自变量同时发生微小变化时,函数值的变化量如何被近似表示为各个自变量变化的线性组合。这一思想在数学分析、物理学、经济学以及工程技术的各个领域中都有着极其广泛的应用。理解全微分是掌握多元微积分的关键一步,它与偏导数、方向导数、梯度等概念密切相关,共同构成了多元微分学的理论体系。
定义
设二元函数 z=f(x,y) 在点 (x0,y0) 的某个邻域内有定义。如果函数在点 (x0,y0) 处的全增量
Δz=f(x0+Δx,y0+Δy)−f(x0,y0)
可以表示为
Δz=AΔx+BΔy+o(ρ)
其中 A 和 B 是与 Δx、Δy 无关的常数,ρ=(Δx)2+(Δy)2,而 o(ρ) 是当 ρ→0 时比 ρ 高阶的无穷小,则称函数 z=f(x,y) 在点 (x0,y0) 处可微,并称 AΔx+BΔy 为函数在点 (x0,y0) 处的全微分,记作
dz=AΔx+BΔy
进一步可以证明,如果函数可微,则 A=fx(x0,y0)(即对 x 的偏导数),B=fy(x0,y0)(即对 y 的偏导数)。因此全微分通常写作
dz=∂x∂zdx+∂y∂zdy
其中 dx=Δx,dy=Δy 是自变量的微分。这个公式直观地表明:函数值的变化近似等于各方向偏导数乘以各自变量变化量的总和。
几何意义
全微分的几何意义是切平面的增量。对于二元函数 z=f(x,y),其在点 (x0,y0) 处的全微分 dz 表示切平面在 z 方向上的增量。从几何上看,当 (Δx,Δy) 很小时,曲面上点附近的曲面可以用切平面来近似代替,这就是"以直代曲"的思想在多元函数中的体现。具体而言,函数图像在点 (x0,y0,z0) 处的切平面方程为
z−z0=fx(x0,y0)(x−x0)+fy(x0,y0)(y−y0)
全微分 dz 正是当 x 和 y 分别变化 dx 和 dy 时,切平面上 z 坐标的变化量。
可微的条件
关于可微性,有以下重要的判别条件:
- 必要条件:如果函数 z=f(x,y) 在点 (x0,y0) 处可微,则它在该点处连续,且偏导数 fx(x0,y0)、fy(x0,y0) 都存在。
- 充分条件:如果函数 z=f(x,y) 的偏导数 fx(x,y)、fy(x,y) 在点 (x0,y0) 的某个邻域内存在且在该点处连续,则函数在该点处可微。
需要特别注意的是,偏导数存在仅是函数可微的必要条件而非充分条件。存在偏导数存在但函数不可微的例子,例如函数
f(x,y)={x2+y2xy,0,(x,y)=(0,0)(x,y)=(0,0)
在 (0,0) 处偏导数存在但不连续,实际上该函数在该点不可微。另一个典型例子是
f(x,y)={x2+y2x2y,0,(x,y)=(0,0)(x,y)=(0,0)
该函数在原点处沿任意方向的方向导数都存在,但函数在原点处不连续,因此不可微。这些例子说明,多元函数的可微性比一元函数复杂得多,仅仅偏导数存在远远不够。
全微分与连续性、偏导数的关系
在一元函数中,可导必连续,且可导与可微等价。但在多元函数中,关系更为复杂:
- 可微一定连续,但连续不一定可微。
- 可微一定偏导数存在,但偏导数存在不一定可微。
- 偏导数连续一定可微,但可微不一定偏导数连续。
因此,多元函数可微性是一个比偏导数存在更强、比偏导数连续更弱的概念。这一层次关系是多元微分学中需要重点掌握的内容。
高阶全微分
如果函数 z=f(x,y) 具有二阶连续偏导数,则可以定义二阶全微分:
d2z=d(dz)=∂x2∂2zdx2+2∂x∂y∂2zdxdy+∂y2∂2zdy2
类似地可以定义更高阶的全微分。高阶全微分在泰勒公式和极值问题中有重要应用。例如,判断多元函数的极值类型时,需要用到二阶全微分(即海森矩阵)的正定性或负定性。若在某驻点处 d2z>0(正定),则该点为极小值点;若 d2z<0(负定),则为极大值点;若 d2z 不定,则为鞍点。
全微分与偏微分的关系
全微分是各个自变量偏微分的线性叠加。对于 n 元函数 y=f(x1,x2,…,xn),其全微分为
dy=∂x1∂fdx1+∂x2∂fdx2+⋯+∂xn∂fdxn
这一形式体现了全微分的一阶微分形式不变性:无论 xi 是自变量还是中间变量,上式都成立。这意味着在求复合函数的全微分时,可以像处理一元函数那样逐层微分,然后将中间变量的微分代入,最终结果与直接使用链式法则得到的结果一致。
应用
全微分在自然科学和工程技术中有广泛的应用。在经济学中,全微分用于分析多个经济变量同时微小变动时产出或效用的变化,例如柯布-道格拉斯生产函数 Q=AKαLβ 的全微分 dQ=∂K∂QdK+∂L∂QdL 可以衡量劳动和资本投入的边际贡献,从而指导企业优化资源配置。在物理学中,全微分用于描述状态函数的变化,如热力学中内能的全微分形式 dU=TdS−PdV,以及吉布斯自由能的全微分 dG=VdP−SdT,这些关系构成了热力学势函数理论的基础,也是推导麦克斯韦关系式的起点。在误差分析中,全微分用于估计多个测量误差对最终结果的综合影响,公式为 Δy≈∑∂xi∂fΔxi,帮助实验人员评估测量精度和系统误差。在地球科学中,全微分用于分析气候变化中各个因素的贡献;在机器学习中,梯度下降法正是基于全微分的概念来更新模型参数。此外,全微分还是隐函数定理、拉格朗日乘数法、条件极值等更高级理论的基础工具。
总而言之,全微分是多元微分学的核心工具,它将复杂的高维变化问题简化为线性近似问题,为理论分析和实际计算提供了强有力的数学手段。掌握全微分不仅有助于理解多元函数的行为,还能为后续学习更深入的数学理论奠定坚实基础。