ARTICLE

可微

可微 (Differentiability) 可微(Differentiability)是数学分析中比导数存在更强的光滑性条件,刻画了函数在某点可用线性映射局部逼近的性质。直观上,若函数在一点可微,则其图像在该点附近近似于一个平面(一元情形为切线),误差相对于自变量的变化趋于零的速度快于自变量本身。这一概念构成了最优化理论、比较静态分析和计量经济学中渐近理论

浏览 4 更新 2025-11-06

可微 (Differentiability)

可微(Differentiability)是数学分析中比导数存在更强的光滑性条件,刻画了函数在某点可用线性映射局部逼近的性质。直观上,若函数在一点可微,则其图像在该点附近近似于一个平面(一元情形为切线),误差相对于自变量的变化趋于零的速度快于自变量本身。这一概念构成了最优化理论比较静态分析计量经济学中渐近理论的数学基础。

一元函数的可微性

对于一元实函数 f:RR f: \mathbb{R} \to \mathbb{R} f f 在点 x0 x_0 可微定义为存在常数 A A 使得:

f(x0+h)=f(x0)+Ah+o(h),h0f(x_0 + h) = f(x_0) + A \cdot h + o(h), \quad h \to 0

其中 o(h) o(h) 表示比 h h 更快趋于零的高阶无穷小量。此时 A A 即为导数 f(x0) f'(x_0) 。在一元情形,可微与导数存在等价,这与多元情形有本质区别。

可微蕴含连续性:若 f f x0 x_0 可微,则 f f x0 x_0 连续。但连续未必可微——最经典的反例绝对值函数 x |x| x=0 x=0 处连续但不可微,因其在该点存在"尖点"(kink),左导数 1 -1 与右导数 +1 +1 不相等。魏尔斯特拉斯函数则展示了更极端的情况:处处连续但处处不可微。

多元函数的可微性

多元标量函数 f:RnR f: \mathbb{R}^n \to \mathbb{R} 在点 a \mathbf{a} 处可微的定义为:存在线性映射 L:RnR L: \mathbb{R}^n \to \mathbb{R} (由梯度 f(a) \nabla f(\mathbf{a}) 表示),使得:

f(a+h)=f(a)+f(a)h+o(h),h0f(\mathbf{a} + \mathbf{h}) = f(\mathbf{a}) + \nabla f(\mathbf{a}) \cdot \mathbf{h} + o(\|\mathbf{h}\|), \quad \|\mathbf{h}\| \to 0

在多元情形,偏导数存在不保证可微——这是与一元函数最本质的区别。反例:函数在原点偏导数均为零但不连续,自然不可微。可微的充分条件是:所有偏导数存在且在 a \mathbf{a} 的某邻域内连续(即 fC1 f \in C^1 ),此时函数称为连续可微

对于向量值函数 f:RnRm \mathbf{f}: \mathbb{R}^n \to \mathbb{R}^m ,可微性由其雅可比矩阵 Df(a) D\mathbf{f}(\mathbf{a}) 刻画,矩阵的每一行对应一个分量函数的梯度。链式法则在此框架下表述为雅可比矩阵的乘积:D(gf)(a)=Dg(f(a))Df(a) D(\mathbf{g} \circ \mathbf{f})(\mathbf{a}) = D\mathbf{g}(\mathbf{f}(\mathbf{a})) \cdot D\mathbf{f}(\mathbf{a})

经济学中的应用

一、最优化的一阶条件:在无约束优化 minf(x) \min f(\mathbf{x}) 中,若 x \mathbf{x}^* 为局部极值点且 f f 可微,则必有 f(x)=0 \nabla f(\mathbf{x}^*) = \mathbf{0} ,这是费马引理的直接推论,构成KKT条件中驻点条件的基础。

二、比较静态分析隐函数定理逆函数定理均以可微性为前提。当外生参数变动时,内生变量的响应方向与幅度由可微隐函数对参数求导得到,这是比较静态分析的数学支柱——例如霍特林引理罗伊恒等式均依赖利润函数和间接效用函数的可微性。

三、边际分析边际效用边际成本边际替代率等核心经济概念本质上是效用函数或生产函数在特定方向的导数。可微性保证了这些边际概念在局部有良好定义,使得一阶条件 MUx/Px=MUy/Py MU_x/P_x = MU_y/P_y 等最优化规则有意义。

四、计量经济学Delta方法要求变换函数 g() g(\cdot) 在真参数处连续可微,才能从 θ^n \hat{\theta}_n 的渐近正态性推出 g(θ^n) g(\hat{\theta}_n) 的渐近分布。极大似然估计的渐近理论同样依赖对数似然函数的可微正则条件——得分函数和海森矩阵的存在均以可微性为前提。

不可微性与次微分

经济学中许多重要函数并非处处可微。绝对值函数 x |x| 在零点不可微,导致LASSO回归L1 L_1 惩罚项产生稀疏解;里昂惕夫生产函数在要素比例最优的拐点处不可微。此时需借助次微分(subdifferential)概念:凸函数 f f 在点 x x 的次微分定义为 f(x)={gf(y)f(x)+gT(yx),y} \partial f(x) = \{g \mid f(y) \geq f(x) + g^T(y-x), \forall y\} 。若 f f x x 可微,则 f(x)={f(x)} \partial f(x) = \{\nabla f(x)\} 。次微分将基于梯度的最优性条件推广至非光滑优化,是凸优化近端算法的理论基石。