可微函数 (Differentiable Function)
可微函数 是数学分析 和微积分学 的核心概念,指在其定义域内每一点都存在导数 的函数。直观而言,一元函数在某点可微意味着该函数在该点附近可以被一条唯一的直线(切线)良好逼近,且逼近误差相对于自变量的变化量趋于零。可微性比连续性 更强:一切可微函数必然连续,但连续函数未必可微。经典反例是绝对值函数 f ( x ) = ∣ x ∣ f(x)=|x| f ( x ) = ∣ x ∣ 在 x = 0 x=0 x = 0 处连续但不可微,因为其左导数为 − 1 -1 − 1 、右导数为 1 1 1 ,左右导数不相等。另一个著名反例是魏尔斯特拉斯函数,它在每一点都连续但在任何一点都不可微,这一发现曾令19世纪的数学家们大为震惊。
一元函数的可微性
设函数 f f f 定义在开区间 ( a , b ) (a,b) ( a , b ) 上,x 0 ∈ ( a , b ) x_0 \in (a,b) x 0 ∈ ( a , b ) 。若极限
lim h → 0 f ( x 0 + h ) − f ( x 0 ) h \lim_{h \to 0} \frac{f(x_0+h)-f(x_0)}{h} h → 0 lim h f ( x 0 + h ) − f ( x 0 )
存在且有限,则称 f f f 在 x 0 x_0 x 0 处可微 ,该极限值记为 f ′ ( x 0 ) f'(x_0) f ′ ( x 0 ) 或 d f d x ( x 0 ) \frac{df}{dx}(x_0) d x df ( x 0 ) 。等价地,存在常数 A A A 使得
f ( x 0 + h ) = f ( x 0 ) + A h + o ( h ) ( h → 0 ) , f(x_0+h) = f(x_0) + A h + o(h) \quad (h \to 0), f ( x 0 + h ) = f ( x 0 ) + A h + o ( h ) ( h → 0 ) ,
其中 o ( h ) o(h) o ( h ) 表示比 h h h 更高阶的无穷小量,即 lim h → 0 o ( h ) / h = 0 \lim_{h\to 0} o(h)/h = 0 lim h → 0 o ( h ) / h = 0 。此时 A = f ′ ( x 0 ) A = f'(x_0) A = f ′ ( x 0 ) 。这一等价定义凸显了可微性的核心思想:函数可以被线性映射良好逼近,而导数正是该线性映射的表示。从几何上看,可微性保证了函数图像在每一点附近都"光滑",不存在尖点、断点或垂直切线。
常见可微函数包括多项式函数 、指数函数 、对数函数 、三角函数 在其定义域内都是可微的。函数的和、差、积、商(分母不为零处)以及复合函数的可微性由求导法则 保证。具体而言,若 f f f 和 g g g 在 x x x 处可微,则 ( f + g ) ′ ( x ) = f ′ ( x ) + g ′ ( x ) (f+g)'(x)=f'(x)+g'(x) ( f + g ) ′ ( x ) = f ′ ( x ) + g ′ ( x ) ,( f g ) ′ ( x ) = f ′ ( x ) g ( x ) + f ( x ) g ′ ( x ) (fg)'(x)=f'(x)g(x)+f(x)g'(x) ( f g ) ′ ( x ) = f ′ ( x ) g ( x ) + f ( x ) g ′ ( x ) (莱布尼茨法则),以及当 g ( x ) ≠ 0 g(x)\neq 0 g ( x ) = 0 时 ( f / g ) ′ ( x ) = [ f ′ ( x ) g ( x ) − f ( x ) g ′ ( x ) ] / [ g ( x ) ] 2 (f/g)'(x)=[f'(x)g(x)-f(x)g'(x)]/[g(x)]^2 ( f / g ) ′ ( x ) = [ f ′ ( x ) g ( x ) − f ( x ) g ′ ( x )] / [ g ( x ) ] 2 。链式法则 是复合函数求导的核心工具:若 g g g 在 x x x 处可微且 f f f 在 g ( x ) g(x) g ( x ) 处可微,则 f ∘ g f \circ g f ∘ g 在 x x x 处可微且 ( f ∘ g ) ′ ( x ) = f ′ ( g ( x ) ) g ′ ( x ) (f \circ g)'(x) = f'(g(x)) \, g'(x) ( f ∘ g ) ′ ( x ) = f ′ ( g ( x )) g ′ ( x ) 。链式法则是微积分中最强大的工具之一,在物理学、工程学和经济学中都有广泛应用。
多元函数的可微性
对于多元函数 f : R n → R m f: \mathbb{R}^n \to \mathbb{R}^m f : R n → R m ,可微性的定义需要借助线性映射 的概念。设 f f f 定义在 R n \mathbb{R}^n R n 的开集 U U U 上,x 0 ∈ U x_0 \in U x 0 ∈ U 。若存在线性映射 L : R n → R m L: \mathbb{R}^n \to \mathbb{R}^m L : R n → R m 使得
lim h → 0 ∥ f ( x 0 + h ) − f ( x 0 ) − L h ∥ ∥ h ∥ = 0 , \lim_{h \to 0} \frac{\|f(x_0+h)-f(x_0)-Lh\|}{\|h\|} = 0, h → 0 lim ∥ h ∥ ∥ f ( x 0 + h ) − f ( x 0 ) − L h ∥ = 0 ,
则称 f f f 在 x 0 x_0 x 0 处可微 ,L L L 称为 f f f 在 x 0 x_0 x 0 处的Fréchet导数 。在标准基下,L L L 表示为 m × n m \times n m × n 的Jacobi矩阵 :
J_f(x_0) = \begin{pmatrix}
\frac{\partial f_1}{\partial x_1}(x_0) & \cdots & \frac{\partial f_1}{\partial x_n}(x_0) \\
\vdots \& \ddots \& \vdots \\
\frac{\partial f_m}{\partial x_1}(x_0) & \cdots & \frac{\partial f_m}{\partial x_n}(x_0)
\end{pmatrix}.
当 m = 1 m=1 m = 1 时(即标量值函数),Jacobi矩阵退化为梯度向量 ∇ f ( x 0 ) = ( ∂ f / ∂ x 1 , … , ∂ f / ∂ x n ) \nabla f(x_0) = (\partial f/\partial x_1, \ldots, \partial f/\partial x_n) ∇ f ( x 0 ) = ( ∂ f / ∂ x 1 , … , ∂ f / ∂ x n ) ,此时可微性条件简化为 f ( x 0 + h ) = f ( x 0 ) + ∇ f ( x 0 ) ⋅ h + o ( ∥ h ∥ ) f(x_0+h) = f(x_0) + \nabla f(x_0) \cdot h + o(\|h\|) f ( x 0 + h ) = f ( x 0 ) + ∇ f ( x 0 ) ⋅ h + o ( ∥ h ∥ ) 。梯度方向是函数增长最快的方向,这一性质在梯度下降法 等优化算法中至关重要。
多元情形下,偏导数存在 不等于可微。偏导数存在且连续(即 C 1 C^1 C 1 类函数)是可微的充分条件,但非必要条件。经典反例是函数
f(x,y) = \begin{cases}
\frac{xy}{x^2+y^2}, & (x,y) \neq (0,0), \\
0, \& (x,y) = (0,0),
\end{cases}
其在原点处两个偏导数都存在(均为零),但函数本身甚至不连续(沿直线 y = x y=x y = x 趋于原点时极限为 1 / 2 1/2 1/2 ),因而不可微。更强的概念是连续可微 (C 1 C^1 C 1 类),即所有偏导数存在且连续,这保证函数可微。方向导数 是偏导数的推广,它刻画了函数沿任意给定方向的变化率。若函数在一点可微,则该点处所有方向导数均存在,且等于梯度与方向向量的内积。
高阶可微性与光滑函数
若函数 f f f 的导数 f ′ f' f ′ 本身仍为可微函数,则可定义二阶导数 f ′ ′ f'' f ′′ ,它刻画了函数图像的弯曲程度。二阶导数的符号与凸性 密切相关:若 f ′ ′ ( x ) > 0 f''(x)>0 f ′′ ( x ) > 0 恒成立,则 f f f 是严格凸函数;若 f ′ ′ ( x ) < 0 f''(x)<0 f ′′ ( x ) < 0 恒成立,则 f f f 是严格凹函数。依此类推,若 f f f 的 k k k 阶导数存在且连续,称 f f f 属于 C k C^k C k 类。若函数任意阶导数均存在,则称为光滑函数 (C ∞ C^\infty C ∞ 类)。解析函数 是光滑函数的子类,其在每一点附近都能展开为收敛的幂级数 。泰勒定理 给出了用多项式逼近可微函数的精确框架:若 f f f 在区间上 n + 1 n+1 n + 1 阶可微,则对任意 x x x 和 x 0 x_0 x 0 ,存在介于二者之间的 ξ \xi ξ 使得
f ( x ) = ∑ k = 0 n f ( k ) ( x 0 ) k ! ( x − x 0 ) k + f ( n + 1 ) ( ξ ) ( n + 1 ) ! ( x − x 0 ) n + 1 . f(x) = \sum_{k=0}^{n} \frac{f^{(k)}(x_0)}{k!}(x-x_0)^k + \frac{f^{(n+1)}(\xi)}{(n+1)!}(x-x_0)^{n+1}. f ( x ) = k = 0 ∑ n k ! f ( k ) ( x 0 ) ( x − x 0 ) k + ( n + 1 )! f ( n + 1 ) ( ξ ) ( x − x 0 ) n + 1 .
该公式的余项称为拉格朗日余项 。泰勒多项式是数值逼近和科学计算的基础工具。中值定理 (拉格朗日中值定理)是泰勒定理在 n = 0 n=0 n = 0 时的特例:若 f f f 在 [ a , b ] [a,b] [ a , b ] 上连续且在 ( a , b ) (a,b) ( a , b ) 内可微,则存在 ξ ∈ ( a , b ) \xi \in (a,b) ξ ∈ ( a , b ) 使得 f ( b ) − f ( a ) = f ′ ( ξ ) ( b − a ) f(b)-f(a)=f'(\xi)(b-a) f ( b ) − f ( a ) = f ′ ( ξ ) ( b − a ) 。这一定理是连接函数整体变化与局部导数行为的桥梁,也是证明其他诸多定理的基石。
在经济学中的应用
可微函数在经济学 中具有基础性地位。边际分析 的核心假设就是经济函数可微:边际成本 是总成本函数的导数,边际效用 是效用函数的导数,边际收益 是总收益函数的导数。在最优化理论 中,一阶条件 f ′ ( x ) = 0 f'(x)=0 f ′ ( x ) = 0 是寻找可微函数极值点的基本工具,而二阶条件 f ′ ′ ( x ) < 0 f''(x)<0 f ′′ ( x ) < 0 (极大值)或 f ′ ′ ( x ) > 0 f''(x)>0 f ′′ ( x ) > 0 (极小值)保证了极值的性质。隐函数定理 依赖可微性,在比较静态分析 中不可或缺。例如,研究税收变化如何影响均衡价格和产量,本质上就是应用隐函数定理来分析内生变量对外生参数的反应。包络定理 则利用可微性简化了参数变化对最优值影响的分析。在计量经济学 中,Delta方法 利用可微性推导估计量的渐近分布:若 n ( θ ^ − θ ) → d N ( 0 , σ 2 ) \sqrt{n}(\hat{\theta}-\theta) \xrightarrow{d} N(0,\sigma^2) n ( θ ^ − θ ) d N ( 0 , σ 2 ) 且 g g g 可微,则 n ( g ( θ ^ ) − g ( θ ) ) → d N ( 0 , [ g ′ ( θ ) ] 2 σ 2 ) \sqrt{n}(g(\hat{\theta})-g(\theta)) \xrightarrow{d} N(0,[g'(\theta)]^2\sigma^2) n ( g ( θ ^ ) − g ( θ )) d N ( 0 , [ g ′ ( θ ) ] 2 σ 2 ) 。生产函数 (如Cobb-Douglas生产函数 Y = A K α L 1 − α Y=AK^\alpha L^{1-\alpha} Y = A K α L 1 − α 和CES生产函数 )以及效用函数 (如CRRA效用函数 u ( c ) = c 1 − γ / ( 1 − γ ) u(c)=c^{1-\gamma}/(1-\gamma) u ( c ) = c 1 − γ / ( 1 − γ ) )通常假设为可微函数,以便应用拉格朗日乘数法 和库恩-塔克条件 求解约束优化问题。欧拉方程 在动态宏观经济学中描述跨期消费的最优路径,它正是通过对可微值函数应用一阶条件推导而来的。总之,可微性为经济学提供了强大的数学分析框架,使严谨的边际分析和理论建模成为可能。
关于知经 KNOWECON
知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌,长期面向北京大学、清华大学、中国人民大学等顶尖院校,提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考,并成功进入理想院校。
知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业,获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者,长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。
我们相信,好的考研辅导不只是押题和陪跑,更是把复杂知识讲清楚、把复习路径设计清楚,并用技术让学习过程更可追踪、更可反馈、更可坚持。