可微 (Differentiability)
可微 (Differentiability)是数学分析 中比导数 存在更强的光滑性条件,刻画了函数在某点可用线性映射局部逼近的性质。直观上,若函数在一点可微,则其图像在该点附近近似于一个平面(一元情形为切线),误差相对于自变量的变化趋于零的速度快于自变量本身。这一概念构成了最优化理论 、比较静态分析 和计量经济学 中渐近理论的数学基础。
一元函数的可微性
对于一元实函数 f : R → R f: \mathbb{R} \to \mathbb{R} f : R → R ,f f f 在点 x 0 x_0 x 0 处可微 定义为存在常数 A A A 使得:
f ( x 0 + h ) = f ( x 0 ) + A ⋅ h + o ( h ) , h → 0 f(x_0 + h) = f(x_0) + A \cdot h + o(h), \quad h \to 0 f ( x 0 + h ) = f ( x 0 ) + A ⋅ h + o ( h ) , h → 0
其中 o ( h ) o(h) o ( h ) 表示比 h h h 更快趋于零的高阶无穷小量。此时 A A A 即为导数 f ′ ( x 0 ) f'(x_0) f ′ ( x 0 ) 。在一元情形,可微与导数存在等价,这与多元情形有本质区别。
可微蕴含连续性 :若 f f f 在 x 0 x_0 x 0 可微,则 f f f 在 x 0 x_0 x 0 连续。但连续未必可微——最经典的反例 是绝对值函数 ∣ x ∣ |x| ∣ x ∣ 在 x = 0 x=0 x = 0 处连续但不可微,因其在该点存在"尖点"(kink),左导数 − 1 -1 − 1 与右导数 + 1 +1 + 1 不相等。魏尔斯特拉斯函数 则展示了更极端的情况:处处连续但处处不可微。
多元函数的可微性
多元标量函数 f : R n → R f: \mathbb{R}^n \to \mathbb{R} f : R n → R 在点 a \mathbf{a} a 处可微的定义为:存在线性映射 L : R n → R L: \mathbb{R}^n \to \mathbb{R} L : R n → R (由梯度 ∇ f ( a ) \nabla f(\mathbf{a}) ∇ f ( a ) 表示),使得:
f ( a + h ) = f ( a ) + ∇ f ( a ) ⋅ h + o ( ∥ h ∥ ) , ∥ h ∥ → 0 f(\mathbf{a} + \mathbf{h}) = f(\mathbf{a}) + \nabla f(\mathbf{a}) \cdot \mathbf{h} + o(\|\mathbf{h}\|), \quad \|\mathbf{h}\| \to 0 f ( a + h ) = f ( a ) + ∇ f ( a ) ⋅ h + o ( ∥ h ∥ ) , ∥ h ∥ → 0
在多元情形,偏导数存在不保证可微 ——这是与一元函数最本质的区别。反例:函数在原点偏导数均为零但不连续,自然不可微。可微的充分条件 是:所有偏导数存在且在 a \mathbf{a} a 的某邻域内连续(即 f ∈ C 1 f \in C^1 f ∈ C 1 ),此时函数称为连续可微 。
对于向量值函数 f : R n → R m \mathbf{f}: \mathbb{R}^n \to \mathbb{R}^m f : R n → R m ,可微性由其雅可比矩阵 D f ( a ) D\mathbf{f}(\mathbf{a}) D f ( a ) 刻画,矩阵的每一行对应一个分量函数的梯度。链式法则 在此框架下表述为雅可比矩阵的乘积:D ( g ∘ f ) ( a ) = D g ( f ( a ) ) ⋅ D f ( a ) D(\mathbf{g} \circ \mathbf{f})(\mathbf{a}) = D\mathbf{g}(\mathbf{f}(\mathbf{a})) \cdot D\mathbf{f}(\mathbf{a}) D ( g ∘ f ) ( a ) = D g ( f ( a )) ⋅ D f ( a ) 。
经济学中的应用
一、最优化的一阶条件 :在无约束优化 min f ( x ) \min f(\mathbf{x}) min f ( x ) 中,若 x ∗ \mathbf{x}^* x ∗ 为局部极值点且 f f f 可微,则必有 ∇ f ( x ∗ ) = 0 \nabla f(\mathbf{x}^*) = \mathbf{0} ∇ f ( x ∗ ) = 0 ,这是费马引理 的直接推论,构成KKT条件 中驻点条件的基础。
二、比较静态分析 :隐函数定理 和逆函数定理 均以可微性为前提。当外生参数变动时,内生变量的响应方向与幅度由可微隐函数对参数求导得到,这是比较静态分析的数学支柱——例如霍特林引理 和罗伊恒等式 均依赖利润函数和间接效用函数的可微性。
三、边际分析 :边际效用 、边际成本 、边际替代率 等核心经济概念本质上是效用函数或生产函数在特定方向的导数。可微性保证了这些边际概念在局部有良好定义,使得一阶条件 M U x / P x = M U y / P y MU_x/P_x = MU_y/P_y M U x / P x = M U y / P y 等最优化规则有意义。
四、计量经济学 :Delta方法 要求变换函数 g ( ⋅ ) g(\cdot) g ( ⋅ ) 在真参数处连续可微,才能从 θ ^ n \hat{\theta}_n θ ^ n 的渐近正态性推出 g ( θ ^ n ) g(\hat{\theta}_n) g ( θ ^ n ) 的渐近分布。极大似然估计 的渐近理论同样依赖对数似然函数的可微正则条件——得分函数和海森矩阵的存在均以可微性为前提。
不可微性与次微分
经济学中许多重要函数并非处处可微。绝对值函数 ∣ x ∣ |x| ∣ x ∣ 在零点不可微,导致LASSO回归 的 L 1 L_1 L 1 惩罚项产生稀疏解;里昂惕夫生产函数 在要素比例最优的拐点处不可微。此时需借助次微分 (subdifferential)概念:凸函数 f f f 在点 x x x 的次微分定义为 ∂ f ( x ) = { g ∣ f ( y ) ≥ f ( x ) + g T ( y − x ) , ∀ y } \partial f(x) = \{g \mid f(y) \geq f(x) + g^T(y-x), \forall y\} ∂ f ( x ) = { g ∣ f ( y ) ≥ f ( x ) + g T ( y − x ) , ∀ y } 。若 f f f 在 x x x 可微,则 ∂ f ( x ) = { ∇ f ( x ) } \partial f(x) = \{\nabla f(x)\} ∂ f ( x ) = { ∇ f ( x )} 。次微分将基于梯度的最优性条件推广至非光滑优化,是凸优化 和近端算法 的理论基石。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。