可微映射 (Differentiable Map)
可微映射 (Differentiable Map)是微积分 、微分几何 和数学分析 中的一个核心概念。它是指一个映射(或称函数)在定义域内的每一点都存在一个局部线性近似——即导数 。更精确地说,一个映射 f : U ⊆ R n → R m f: U \subseteq \mathbb{R}^n \to \mathbb{R}^m f : U ⊆ R n → R m 在点 a ∈ U a \in U a ∈ U 处是可微的,如果存在一个线性映射 D f ( a ) : R n → R m Df(a): \mathbb{R}^n \to \mathbb{R}^m D f ( a ) : R n → R m ,使得 f f f 在 a a a 附近可以用该线性映射加上一个高阶无穷小项来近似。这一概念将一元函数的可微性推广到了多变量和高维输出的情境,是现代经济学中广泛使用的数学工具。
定义与基本性质
欧氏空间中的可微性
设 U ⊆ R n U \subseteq \mathbb{R}^n U ⊆ R n 为开集,考虑映射 f : U → R m f: U \to \mathbb{R}^m f : U → R m 。称 f f f 在点 a ∈ U a \in U a ∈ U 处可微 ,如果存在一个 m × n m \times n m × n 矩阵 A A A (称为 f f f 在 a a a 处的雅可比矩阵 ,记为 J f ( a ) J_f(a) J f ( a ) 或 D f ( a ) Df(a) D f ( a ) ),使得:
lim h → 0 ∥ f ( a + h ) − f ( a ) − A h ∥ ∥ h ∥ = 0 \lim_{h \to 0} \frac{\| f(a+h) - f(a) - A\,h \|}{\|h\|} = 0 h → 0 lim ∥ h ∥ ∥ f ( a + h ) − f ( a ) − A h ∥ = 0
其中 h ∈ R n h \in \mathbb{R}^n h ∈ R n 是方向向量,∥ ⋅ ∥ \|\cdot\| ∥ ⋅ ∥ 表示欧几里得范数。线性部分 A h A h A h 就是 f f f 在 a a a 处的微分 (或称全微分 、切映射 )。当 h h h 很小时,以下仿射近似成立:
f ( a + h ) ≈ f ( a ) + D f ( a ) ⋅ h f(a+h) \approx f(a) + Df(a) \cdot h f ( a + h ) ≈ f ( a ) + D f ( a ) ⋅ h
映射 f f f 本身可以写成分量形式 f = ( f 1 , f 2 , … , f m ) f = (f_1, f_2, \dots, f_m) f = ( f 1 , f 2 , … , f m ) ,其中每个 f k : U → R f_k: U \to \mathbb{R} f k : U → R 是一个实值函数。若 f f f 在 a a a 处可微,则每个分量 f k f_k f k 在 a a a 处也可微,且雅可比矩阵由各分量的偏导数构成:
D f ( a ) = [ ∂ f 1 ∂ x 1 ( a ) ∂ f 1 ∂ x 2 ( a ) ⋯ ∂ f 1 ∂ x n ( a ) ∂ f 2 ∂ x 1 ( a ) ∂ f 2 ∂ x 2 ( a ) ⋯ ∂ f 2 ∂ x n ( a ) ⋮ ⋮ ⋱ ⋮ ∂ f m ∂ x 1 ( a ) ∂ f m ∂ x 2 ( a ) ⋯ ∂ f m ∂ x n ( a ) ] Df(a) =
\begin{bmatrix}
\frac{\partial f_1}{\partial x_1}(a) & \frac{\partial f_1}{\partial x_2}(a) & \cdots & \frac{\partial f_1}{\partial x_n}(a) \\
\frac{\partial f_2}{\partial x_1}(a) & \frac{\partial f_2}{\partial x_2}(a) & \cdots & \frac{\partial f_2}{\partial x_n}(a) \\
\vdots & \vdots & \ddots & \vdots \\
\frac{\partial f_m}{\partial x_1}(a) & \frac{\partial f_m}{\partial x_2}(a) & \cdots & \frac{\partial f_m}{\partial x_n}(a)
\end{bmatrix} D f ( a ) = ∂ x 1 ∂ f 1 ( a ) ∂ x 1 ∂ f 2 ( a ) ⋮ ∂ x 1 ∂ f m ( a ) ∂ x 2 ∂ f 1 ( a ) ∂ x 2 ∂ f 2 ( a ) ⋮ ∂ x 2 ∂ f m ( a ) ⋯ ⋯ ⋱ ⋯ ∂ x n ∂ f 1 ( a ) ∂ x n ∂ f 2 ( a ) ⋮ ∂ x n ∂ f m ( a )
可微性与连续性的关系
可微性是比连续性更强的要求:若 f f f 在 a a a 处可微,则 f f f 在 a a a 处连续。但反过来不成立:连续映射未必可微。例如,函数 f ( x ) = ∣ x ∣ f(x) = |x| f ( x ) = ∣ x ∣ 在原点连续但不可微。另外,方向导数存在(甚至所有偏导数存在)并不足以保证可微性——可微性要求线性近似在所有方向上一致地有效。只有当所有偏导数在 a a a 的某个邻域内存在且连续 时,f f f 在 a a a 处才是可微的(此时称 f f f 属于 C 1 C^1 C 1 类)。
高阶可微性与光滑映射
如果映射 f f f 的雅可比矩阵 D f ( a ) Df(a) D f ( a ) 自身作为从 U U U 到 R m × n \mathbb{R}^{m \times n} R m × n 的映射也是可微的,我们称 f f f 是二阶可微 的,其二阶导数 由海森矩阵 (当 m = 1 m=1 m = 1 时)或更一般的双线性形式表示。一般地:
f ∈ C 0 f \in C^0 f ∈ C 0 (C 0 C^0 C 0 类):f f f 是连续映射。f ∈ C 1 f \in C^1 f ∈ C 1 (C 1 C^1 C 1 类):f f f 的每个偏导数存在且连续,等价于 D f Df D f 作为映射是连续的。f ∈ C k f \in C^k f ∈ C k (C k C^k C k 类):f f f 的直到 k k k 阶的偏导数都存在且连续。f ∈ C ∞ f \in C^\infty f ∈ C ∞ (C ∞ C^\infty C ∞ 类):f f f 具有任意阶连续偏导数,称为光滑映射 (Smooth Map)。
在经济学中,我们通常假设效用函数、生产函数和需求函数等是 C 2 C^2 C 2 类(二阶连续可微)甚至光滑的,以方便进行比较静态分析和运用隐函数定理 。
链式法则
链式法则 (Chain Rule)是研究可微映射合成后行为的基本工具。设有两个映射:
R n → f R m → g R p \mathbb{R}^n \xrightarrow{f} \mathbb{R}^m \xrightarrow{g} \mathbb{R}^p R n f R m g R p
其中 f f f 在 a a a 处可微,g g g 在 f ( a ) f(a) f ( a ) 处可微,则合成映射 h = g ∘ f : R n → R p h = g \circ f: \mathbb{R}^n \to \mathbb{R}^p h = g ∘ f : R n → R p 在 a a a 处可微,且其雅可比矩阵满足:
D h ( a ) = D g ( f ( a ) ) ⋅ D f ( a ) Dh(a) = Dg(f(a)) \cdot Df(a) D h ( a ) = D g ( f ( a )) ⋅ D f ( a )
这是一个 p × n p \times n p × n 矩阵等于 p × m p \times m p × m 矩阵与 m × n m \times n m × n 矩阵的乘积。用偏导数的分量形式表达:
∂ h i ∂ x j ( a ) = ∑ k = 1 m ∂ g i ∂ y k ( f ( a ) ) ⋅ ∂ f k ∂ x j ( a ) \frac{\partial h_i}{\partial x_j}(a) = \sum_{k=1}^{m} \frac{\partial g_i}{\partial y_k}(f(a)) \cdot \frac{\partial f_k}{\partial x_j}(a) ∂ x j ∂ h i ( a ) = k = 1 ∑ m ∂ y k ∂ g i ( f ( a )) ⋅ ∂ x j ∂ f k ( a )
链式法则在经济学中有广泛应用。例如,考虑消费者的间接效用函数 V ( p , w ) = U ( x ∗ ( p , w ) ) V(p, w) = U(x^*(p, w)) V ( p , w ) = U ( x ∗ ( p , w )) ——它是直接效用函数 U U U 与马歇尔需求函数 x ∗ ( p , w ) x^*(p, w) x ∗ ( p , w ) 的合成。利用链式法则可推导罗伊恒等式 (Roy's Identity),建立间接效用函数的偏导数与马歇尔需求函数之间的关系。
关键定理
反函数定理 (Inverse Function Theorem)
反函数定理 表明:设 f : U ⊆ R n → R n f: U \subseteq \mathbb{R}^n \to \mathbb{R}^n f : U ⊆ R n → R n 是 C 1 C^1 C 1 类映射,若在点 a ∈ U a \in U a ∈ U 处雅可比矩阵 D f ( a ) Df(a) D f ( a ) 是可逆矩阵 (即 det D f ( a ) ≠ 0 \det Df(a) \neq 0 det D f ( a ) = 0 ),则存在 a a a 的邻域 V ⊆ U V \subseteq U V ⊆ U 和 f ( a ) f(a) f ( a ) 的邻域 W W W ,使得 f : V → W f: V \to W f : V → W 是一个双射,且其逆映射 f − 1 : W → V f^{-1}: W \to V f − 1 : W → V 也是 C 1 C^1 C 1 类的,并满足:
D ( f − 1 ) ( f ( a ) ) = [ D f ( a ) ] − 1 D(f^{-1})(f(a)) = [Df(a)]^{-1} D ( f − 1 ) ( f ( a )) = [ D f ( a ) ] − 1
通俗地说,如果雅可比行列式非零,f f f 在局部就是一个可逆的坐标变换。该定理在经济学中用于分析市场均衡的唯一性、比较静态的符号判定等问题。
隐函数定理 (Implicit Function Theorem)
隐函数定理 是反函数定理的推广,也是经济学中最常引用的数学工具之一。设 F : R n × R m → R m F: \mathbb{R}^n \times \mathbb{R}^m \to \mathbb{R}^m F : R n × R m → R m 是 C 1 C^1 C 1 类映射,若在点 ( a , b ) (a, b) ( a , b ) 处有 F ( a , b ) = 0 F(a, b) = 0 F ( a , b ) = 0 ,且 m × m m \times m m × m 偏导数子矩阵 ∂ F ∂ y ( a , b ) \frac{\partial F}{\partial y}(a, b) ∂ y ∂ F ( a , b ) 可逆,则在 a a a 附近存在唯一的 C 1 C^1 C 1 映射 y = φ ( x ) y = \varphi(x) y = φ ( x ) 使得:
F ( x , φ ( x ) ) = 0 F(x, \varphi(x)) = 0 F ( x , φ ( x )) = 0
并且偏导数为:
D φ ( a ) = − [ ∂ F ∂ y ( a , b ) ] − 1 ⋅ ∂ F ∂ x ( a , b ) D\varphi(a) = -\left[\frac{\partial F}{\partial y}(a, b)\right]^{-1} \cdot \frac{\partial F}{\partial x}(a, b) D φ ( a ) = − [ ∂ y ∂ F ( a , b ) ] − 1 ⋅ ∂ x ∂ F ( a , b )
在经济学中,隐函数定理支撑了比较静态分析方法:当我们要了解外生变量 x x x 的变化如何影响内生变量 y y y 的均衡 值时,它保证了这种变化关系是良好定义的且可微的。例如,求解市场的均衡价格如何随税率变化、消费者最优消费束如何随收入和价格变化等问题,都依赖于此定理。
流形上的可微映射
将可微映射的概念从欧氏空间推广到流形是现代微分几何的核心步骤。设 M M M 和 N N N 是两个微分流形(维度分别为 n n n 和 m m m ),映射 ϕ : M → N \phi: M \to N ϕ : M → N 在点 p ∈ M p \in M p ∈ M 处是可微的 (或光滑的),如果通过局部的坐标卡 ( U , φ ) (U, \varphi) ( U , φ ) 和 ( V , ψ ) (V, \psi) ( V , ψ ) (满足 p ∈ U p \in U p ∈ U ,ϕ ( p ) ∈ V \phi(p) \in V ϕ ( p ) ∈ V )将问题"拉回"到欧氏空间后,ψ ∘ ϕ ∘ φ − 1 : φ ( U ∩ ϕ − 1 ( V ) ) ⊆ R n → R m \psi \circ \phi \circ \varphi^{-1}: \varphi(U \cap \phi^{-1}(V)) \subseteq \mathbb{R}^n \to \mathbb{R}^m ψ ∘ ϕ ∘ φ − 1 : φ ( U ∩ ϕ − 1 ( V )) ⊆ R n → R m 在欧氏空间意义下是可微的。
由此,对每一点 p ∈ M p \in M p ∈ M ,可以定义切映射 (或微分):
d ϕ p : T p M → T ϕ ( p ) N d\phi_p: T_pM \to T_{\phi(p)}N d ϕ p : T p M → T ϕ ( p ) N
它将 M M M 上 p p p 点处的切空间 T p M T_pM T p M 中的切向量 v v v 映射到 N N N 上 ϕ ( p ) \phi(p) ϕ ( p ) 处的切空间中。直观上,d ϕ p ( v ) d\phi_p(v) d ϕ p ( v ) 描述了 M M M 上通过 p p p 点、初始方向为 v v v 的曲线在 ϕ \phi ϕ 映射下被"扭曲"的程度和方向。在局部坐标下,切映射 d ϕ p d\phi_p d ϕ p 正好由雅可比矩阵表示。
在经济学中的应用
可微映射及其相关定理几乎是所有现代经济分析的语言。几个典型例子:
效用最大化问题 :马歇尔需求函数 x ( p , w ) x(p, w) x ( p , w ) 将价格向量 p p p 和财富 w w w 映射到最优消费束。分析价格变化对需求的影响(即斯勒茨基方程的推导)依赖需求函数的可微性,并通过链式法则和隐函数定理完成。一般均衡理论 :超额需求函数 z ( p ) z(p) z ( p ) 将价格向量映射为超额需求向量。基于布劳威尔不动点定理证明均衡价格的存在性后,通常利用反函数定理和萨德引理讨论均衡的局部唯一性和正则性。最优控制与动态规划 :在动态优化 问题中,值函数 V ( x ) V(x) V ( x ) 将状态变量映射为最大可能收益。利用包络定理 (Envelope Theorem)计算值函数的导数——即状态影子的价格——本身就是对可微映射链式法则的深刻应用。比较静态分析 :几乎所有的比较静态分析——税负如何影响劳动供给、技术进步如何影响工资、货币政策如何影响产出——都在假设均衡映射是 C 1 C^1 C 1 类可微的前提下,通过计算相应的雅可比矩阵并判断其分量的符号来完成。
总而言之,可微映射不仅是数学分析中的基本研究对象,更是现代经济学理论大厦的"混凝土"。它为最优化的一阶条件、均衡的局部稳定性分析、以及从一个变量变动的方向推断另一变量变动的方向提供了严格的逻辑框架。理解可微映射的定义、性质和核心定理是深入学习高级经济理论的必要前提。