ARTICLE

变分法

变分法 变分法 (Calculus of Variations) 是数学分析的一个重要分支,其研究对象是泛函 (functional) 的极值问题。所谓泛函,是指从函数空间到实数的映射——换言之,泛函的"自变量"是函数,而"因变量"是一个实数。变分法的目标是在满足一定约束条件的函数集合中,找出使某个泛函达到极大值或极小值的函数。这一思想可以追溯到微积分诞生之

浏览 0 更新 2026-05-27

变分法

变分法 (Calculus of Variations) 是数学分析的一个重要分支,其研究对象是泛函 (functional) 的极值问题。所谓泛函,是指从函数空间到实数的映射——换言之,泛函的"自变量"是函数,而"因变量"是一个实数。变分法的目标是在满足一定约束条件的函数集合中,找出使某个泛函达到极大值或极小值的函数。这一思想可以追溯到微积分诞生之初,最著名的早期问题当属约翰·伯努利在1696年提出的最速降线问题 (brachistochrone problem):在重力作用下,一个质点从点A滑到点B(A高于B但不在同一竖直线上),应沿何种曲线路径才能使所需时间最短?伽利略曾误认为答案是圆弧,而伯努利兄弟、莱布尼茨和牛顿等人则通过不同的方法正确地证明该曲线是摆线 (cycloid)。这一问题的解决标志着变分法的正式诞生。

基本概念与欧拉-拉格朗日方程

变分法的核心结果是欧拉-拉格朗日方程 (Euler-Lagrange equation)。考虑一类最基本的变分问题:在满足固定边界条件 y(x1)=y1y(x_1)=y_1y(x2)=y2y(x_2)=y_2 的所有二阶可微函数中,寻找使积分型泛函

J[y]=x1x2F(x,y(x),y(x))dxJ[y] = \int_{x_1}^{x_2} F(x, y(x), y'(x)) \, dx

达到极值的函数 y(x)y(x)。欧拉和拉格朗日在18世纪中叶独立地导出,若 y(x)y(x) 是极值函数,则它必须满足以下微分方程:

Fyddx(Fy)=0.\frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) = 0.

这一方程被称为欧拉-拉格朗日方程,是变分法中最基本的必要条件。推导该方程的核心思想是考虑对极值函数施加一个微小的扰动 ϵη(x)\epsilon \eta(x)(其中 η(x)\eta(x) 在端点处为零),然后令泛函的一阶变分 δJ=0\delta J = 0

多变量与约束极值

变分法的应用远不止单个未知函数的情形。对于含有多个未知函数的泛函 J[y1,y2,,yn]J[y_1, y_2, \dots, y_n],可以得到一组欧拉-拉格朗日方程,每个未知函数对应一个方程。对于含有高阶导数的泛函 J[y]=F(x,y,y,y,,y(n))dxJ[y] = \int F(x, y, y', y'', \dots, y^{(n)}) \, dx,欧拉-拉格朗日方程推广为

Fyddx(Fy)+d2dx2(Fy)+(1)ndndxn(Fy(n))=0.\frac{\partial F}{\partial y} - \frac{d}{dx}\left(\frac{\partial F}{\partial y'}\right) + \frac{d^2}{dx^2}\left(\frac{\partial F}{\partial y''}\right) - \cdots + (-1)^n \frac{d^n}{dx^n}\left(\frac{\partial F}{\partial y^{(n)}}\right) = 0.

当泛函极值问题带有约束条件时,需要引入拉格朗日乘子法 (Lagrange multipliers)。例如,经典的等周问题 (isoperimetric problem) 是在给定曲线长度的条件下,求所围面积最大的曲线。这类问题将约束条件通过拉格朗日乘子 λ\lambda 并入泛函,构造增广泛函后导出相应的欧拉-拉格朗日方程。更一般的约束形式(如微分方程约束)则需要依赖庞特里亚金最大值原理 (Pontryagin's maximum principle) 等更高级的工具。

充分条件与勒让德条件

欧拉-拉格朗日方程仅给出极值的必要条件。要判断一个驻留函数是否真正使泛函取极小值,还需要考察二阶变分 δ2J\delta^2 J 的符号。勒让德条件 (Legendre condition) 指出,对于极小值问题,在极值函数上必须满足

2Fy20\frac{\partial^2 F}{\partial y'^2} \geq 0

对所有 xx 成立(强勒让德条件要求严格大于零)。更强的充分条件涉及雅可比条件 (Jacobi condition),要求共轭点不出现在区间内部。

变分法与最优控制理论

变分法与最优控制理论 (optimal control theory) 有着深厚的渊源。20世纪中叶,随着航天工程和运筹学的发展,经典变分法在面临控制变量受不等式约束的问题时暴露出局限性。庞特里亚金于1956年提出的最大值原理可以视为变分法在现代控制理论中的直接推广。另一方面,理查德·贝尔曼提出的动态规划 (dynamic programming) 则基于贝尔曼最优性原理,通过哈密顿-雅可比-贝尔曼方程 (Hamilton-Jacobi-Bellman equation) 从另一个角度解决了最优控制问题。在经济学中,最优控制理论被广泛应用于经济增长模型资源经济学宏观经济学中的跨期优化问题,例如Ramsey模型新古典增长模型就是变分法思想的经典应用。

变分法的现代发展

在当代数学中,变分法已经远远超越了古典分析的范围。直接法 (direct methods) 利用泛函的凸性、下半连续性以及Sobolev空间中的紧性来证明极值函数的存在性,无需通过欧拉-拉格朗日方程求解。这一方法在非线性弹性力学相变理论图像处理中发挥了关键作用。此外,变分法还与有限元方法 (finite element method) 紧密结合:许多偏微分方程的数值解可以通过变分原理转化为泛函极小化问题,然后使用有限元方法进行离散求解。

在经济和金融领域,变分法的应用同样广泛。例如,在资产定价中,通过变分法可以推导最优消费-投资策略;在机制设计中,最优契约的设计往往涉及泛函极值问题;在产业组织中,动态寡头竞争模型的求解也常常借助变分法的思想。

总之,变分法作为连接数学、物理、工程和经济学的桥梁性学科,其核心思想——通过对函数的微小扰动来推导最优性条件——深刻影响了现代科学的发展。从最速降线到黑洞物理学,从最优经济增长到深度学习中的神经网络训练,变分法的身影无处不在。