ARTICLE

偏微分

偏微分 (Partial Derivative) 偏微分(Partial Derivative),又称偏导数,是多元微积分中最基本的概念,描述了一个多元函数关于其中一个自变量的瞬时变化率,而其余自变量保持不变。与一元函数的导数不同,偏微分刻画的是函数沿某一坐标轴方向的局部变化,是多变量分析、优化理论和数理经济学的基石。在经济学、物理学和工程学中,几乎所有涉及

浏览 0 更新 2025-11-24

偏微分 (Partial Derivative)

偏微分(Partial Derivative),又称偏导数,是多元微积分中最基本的概念,描述了一个多元函数关于其中一个自变量的瞬时变化率,而其余自变量保持不变。与一元函数的导数不同,偏微分刻画的是函数沿某一坐标轴方向的局部变化,是多变量分析、优化理论和数理经济学的基石。在经济学物理学工程学中,几乎所有涉及多变量系统的模型都依赖偏微分来描述变量间的边际关系。

定义与记号

f(x1,x2,,xn)f(x_1, x_2, \ldots, x_n) 为一个 nn 元函数。ff 关于变量 xix_i 的偏导数定义为下列极限(若存在):

fxi=limh0f(x1,,xi+h,,xn)f(x1,,xi,,xn)h\frac{\partial f}{\partial x_i} = \lim_{h \to 0} \frac{f(x_1, \ldots, x_i + h, \ldots, x_n) - f(x_1, \ldots, x_i, \ldots, x_n)}{h}

直观上,该定义将除 xix_i 以外的所有变量"冻结"为常数,然后按一元微积分中普通导数的定义进行计算。这一"冻结其余变量"的思想是理解偏微分的核心。

常见记号包括:

fxi,fxi,xif,Dif\frac{\partial f}{\partial x_i}, \quad f_{x_i}, \quad \partial_{x_i} f, \quad D_i f

其中 \partial(读作"round d"或"partial")由法国数学家勒让德于 1786 年首次引入,后经雅可比推广,成为偏微分的标准符号。

计算法则

偏微分的计算操作上与普通导数一致:将不涉及当前求导变量的其他自变量视为常数,然后运用一元微积分的所有求导法则(和、积、商、链式法则等)。关键在于每次求导时始终记住"谁在变、谁不变"。

示例一:设 f(x,y)=x3y2+2xy+sinxf(x, y) = x^3 y^2 + 2x y + \sin x

fx=3x2y2+2y+cosx,fy=2x3y+2x\frac{\partial f}{\partial x} = 3x^2 y^2 + 2y + \cos x, \qquad \frac{\partial f}{\partial y} = 2x^3 y + 2x

示例二:对于柯布-道格拉斯生产函数 Q(L,K)=ALαKβQ(L, K) = A L^{\alpha} K^{\beta},边际产量由偏导数给出:

MPL=QL=αALα1Kβ,MPK=QK=βALαKβ1MP_L = \frac{\partial Q}{\partial L} = \alpha A L^{\alpha - 1} K^{\beta}, \qquad MP_K = \frac{\partial Q}{\partial K} = \beta A L^{\alpha} K^{\beta - 1}

几何解释

对于二元函数 z=f(x,y)z = f(x, y),偏导数 fx(a,b)\frac{\partial f}{\partial x}(a, b) 表示曲面 z=f(x,y)z = f(x, y) 在点 (a,b,f(a,b))(a, b, f(a, b)) 处沿 xx 轴方向的切线斜率。具体而言,用平面 y=by = b 截曲面得到一条曲线 z=f(x,b)z = f(x, b),该曲线在 x=ax = a 处的普通导数即为 fx(a,b)\frac{\partial f}{\partial x}(a, b)。类似地,fy\frac{\partial f}{\partial y} 对应于沿 yy 轴方向的切线斜率。

高阶偏微分

偏导数可以迭代求导,得到高阶偏导数。对于二元函数 f(x,y)f(x, y),有四种二阶偏导数:

2fx2,2fy2,2fyx,2fxy\frac{\partial^2 f}{\partial x^2}, \quad \frac{\partial^2 f}{\partial y^2}, \quad \frac{\partial^2 f}{\partial y \partial x}, \quad \frac{\partial^2 f}{\partial x \partial y}

后两者为混合偏导数,它们对求导顺序敏感。克莱罗定理(Clairaut's Theorem),又称施瓦茨定理,指出:若二阶混合偏导数在某个开集上连续,则求导顺序可交换:

2fyx=2fxy\frac{\partial^2 f}{\partial y \partial x} = \frac{\partial^2 f}{\partial x \partial y}

在经济学优化中,二阶偏导数构成的黑塞矩阵(Hessian Matrix)用于判断临界点是极大值、极小值还是鞍点。黑塞矩阵的对称性(源于克莱罗定理)在杨氏定理(Young's Theorem)的框架下得到保证,这在消费者理论和生产者理论的对偶性分析中尤为重要。

梯度与方向导数

将所有一阶偏导数组合成向量,得梯度(Gradient):

f=(fx1,fx2,,fxn)\nabla f = \left( \frac{\partial f}{\partial x_1}, \frac{\partial f}{\partial x_2}, \ldots, \frac{\partial f}{\partial x_n} \right)

梯度有两个关键性质:其一,它指向函数值上升最快的方向;其二,其模长 f\|\nabla f\| 等于该方向上的最大变化率。沿任意单位向量 u\mathbf{u}方向导数可通过梯度投影计算:

Duf=fu=fcosθD_{\mathbf{u}} f = \nabla f \cdot \mathbf{u} = \|\nabla f\| \cos \theta

其中 θ\theta 为梯度方向与 u\mathbf{u} 之间的夹角。当 u\mathbf{u} 与梯度方向一致(θ=0\theta = 0)时方向导数取最大值;垂直时(θ=π/2\theta = \pi/2)方向导数为零,对应等高线的切线方向。

全微分与可微性

偏导数存在并不保证函数连续或可微(经典反例:f(x,y)=xyx2+y2f(x, y) = \frac{xy}{x^2 + y^2} 在原点偏导数存在但不连续)。更强的条件是全可微性:若 ff 在点 x0\mathbf{x}_0 处可微,则全微分为:

df=fx1dx1+fx2dx2++fxndxn=fdxdf = \frac{\partial f}{\partial x_1} dx_1 + \frac{\partial f}{\partial x_2} dx_2 + \cdots + \frac{\partial f}{\partial x_n} dx_n = \nabla f \cdot d\mathbf{x}

全微分提供了函数值的线性近似(一阶泰勒展开):

f(x0+Δx)f(x0)+f(x0)Δxf(\mathbf{x}_0 + \Delta\mathbf{x}) \approx f(\mathbf{x}_0) + \nabla f(\mathbf{x}_0) \cdot \Delta\mathbf{x}

若所有一阶偏导数存在且连续(即 fC1f \in C^1),则 ff 必然可微。这一条件在隐函数定理的假设中反复出现。

链式法则

多元链式法则是偏微分最重要的运算工具。若 z=f(x,y)z = f(x, y)x=x(t)x = x(t), y=y(t)y = y(t),则全导数为:

dzdt=fxdxdt+fydydt\frac{dz}{dt} = \frac{\partial f}{\partial x} \frac{dx}{dt} + \frac{\partial f}{\partial y} \frac{dy}{dt}

更一般地,若中间变量本身也是多元函数,则偏导数按树状结构传播。链式法则在比较静态分析中用于追踪外生变量变动如何通过模型结构传导至内生变量,是包络定理(Envelope Theorem)推导的基础。

隐函数定理

偏微分在隐函数定理(Implicit Function Theorem)中扮演核心角色。若方程 F(x,y)=0F(x, y) = 0 在点 (x0,y0)(x_0, y_0) 附近满足 Fy(x0,y0)0F_y(x_0, y_0) \neq 0,则在局部存在隐函数 y=g(x)y = g(x),且其导数为:

dydx=FxFy\frac{dy}{dx} = -\frac{F_x}{F_y}

这一结果直接由偏微分的商给出。在经济学中,隐函数定理是推导无差异曲线斜率(边际替代率 MRS =UxUy= -\frac{U_x}{U_y})和等产量线斜率(边际技术替代率 MRTS =MPLMPK= -\frac{MP_L}{MP_K})的数学依据。

在经济学中的应用

边际分析:偏微分是经济学边际分析的语言。边际效用 MUi=UxiMU_i = \frac{\partial U}{\partial x_i} 量化了在其他商品不变时,追加消费一单位商品 ii 的效用增量。边际产量 MPL=QLMP_L = \frac{\partial Q}{\partial L} 和边际成本 MC=TCQMC = \frac{\partial TC}{\partial Q} 同样定义为偏导数。这一框架贯穿微观经济学的全部决策理论。

比较静态:当模型参数变化时,偏微分刻画内生变量的响应方向与幅度。需求函数 xi(p,m)x_i^*(p, m) 关于价格的偏导数 xipj\frac{\partial x_i^*}{\partial p_j} 分解为收入效应和替代效应,这正是斯勒茨基方程(Slutsky Equation)的核心内容。

计量经济学:线性回归中系数 βj=YXj\beta_j = \frac{\partial Y}{\partial X_j} 被解释为偏效应——在其他自变量不变的条件下,XjX_j 变动一单位对 YY 的边际影响。这正是偏微分"固定其余变量"思想的直接应用。

最优化:无约束优化的一阶条件 f=0\nabla f = 0 是寻找极值的出发点。约束优化中,拉格朗日乘数法构造 L(x,λ)=f(x)λg(x)\mathcal{L}(x, \lambda) = f(x) - \lambda g(x),通过 L=0\nabla \mathcal{L} = 0 求解,其本质仍是偏微分的系统运用。二阶条件中,加边黑塞矩阵(Bordered Hessian)的行列式符号由偏导数决定,用以区分极大值和极小值。

弹性与对数导数:弹性 ε=lnylnx=xyyx\varepsilon = \frac{\partial \ln y}{\partial \ln x} = \frac{x}{y} \frac{\partial y}{\partial x} 将偏导数转化为无量纲量,广泛用于需求和供给分析。超越对数函数(Translog)和对数线性模型均利用这种变换来简化偏导数的经济解释。

动态优化:在最优控制动态规划中,哈密顿函数和贝尔曼方程对状态变量和控制变量求偏导,得出最优路径的必要条件(庞特里亚金最大值原理)。偏微分因此成为连接静态分析与动态分析的数学桥梁。