ARTICLE

最优控制理论

最优控制理论 (Optimal Control Theory) 最优控制理论(Optimal Control Theory)是数学和工程学中的一个分支,研究如何在给定动态系统中寻找使特定性能指标达到最优的控制策略。该理论起源于17世纪的变分法,在20世纪50年代由庞特里亚金(Pontryagin)和贝尔曼(Bellman)等人系统化建立,现已成为宏观经济学、

浏览 0 更新 2025-10-26

最优控制理论 (Optimal Control Theory)

最优控制理论(Optimal Control Theory)是数学工程学中的一个分支,研究如何在给定动态系统中寻找使特定性能指标达到最优的控制策略。该理论起源于17世纪的变分法,在20世纪50年代由庞特里亚金(Pontryagin)和贝尔曼(Bellman)等人系统化建立,现已成为宏观经济学金融工程航空航天机器人学中动态决策的标准工具。

核心问题与数学表述

最优控制问题的标准表述为,在状态方程约束下最小化目标泛函。设状态变量 x(t)Rnx(t) \in \mathbb{R}^n、控制变量 u(t)Rmu(t) \in \mathbb{R}^m,系统动态由微分方程 x˙(t)=f(x(t),u(t),t)\dot{x}(t) = f(x(t), u(t), t) 描述,初始状态 x(t0)=x0x(t_0) = x_0 已知。目标为选择控制路径 u(t)u(t) 使性能泛函最小化:

J(u)=ϕ(x(T),T)+t0TL(x(t),u(t),t)dtJ(u) = \phi(x(T), T) + \int_{t_0}^{T} L(x(t), u(t), t) \, dt

其中 ϕ\phi 为终端成本,LL 为运行成本。终端时间 TT 可固定也可自由,终端状态可受约束。

庞特里亚金极大值原理

庞特里亚金极大值原理(Pontryagin's Maximum Principle)是求解最优控制问题的核心工具,给出了最优控制的必要条件。定义哈密顿函数

H(x,u,λ,t)=L(x,u,t)+λf(x,u,t)H(x, u, \lambda, t) = L(x, u, t) + \lambda^{\top} f(x, u, t)

其中 λ(t)Rn\lambda(t) \in \mathbb{R}^n 为协态变量,衡量状态微小变动对目标泛函的边际影响。极大值原理给出:最优控制 u(t)u^*(t) 在每时刻最大化哈密顿函数,即 u(t)=argmaxuH(x,u,λ,t)u^*(t) = \arg\max_u H(x^*, u, \lambda, t);状态方程 x˙=H/λ\dot{x} = \partial H / \partial \lambda;协态方程 λ˙=H/x\dot{\lambda} = -\partial H / \partial x;横截条件 λ(T)=ϕ/x(T)\lambda(T) = \partial \phi / \partial x(T) 处理终端约束。

动态规划与HJB方程

贝尔曼的动态规划方法将原问题分解为一系列从后向前的递归子问题。定义值函数 V(x,t)V(x, t) 为从状态 xx 时刻 tt 出发的最优余下成本。Hamilton-Jacobi-Bellman(HJB)方程:

Vt=minu{L(x,u,t)+Vxf(x,u,t)}-\frac{\partial V}{\partial t} = \min_u \left\{ L(x, u, t) + \frac{\partial V}{\partial x}^{\top} f(x, u, t) \right\}

边界条件 V(x,T)=ϕ(x,T)V(x, T) = \phi(x, T)。HJB方程是偏微分方程,在解析求解受限时通常借助数值方法。

经济学应用

宏观经济学中,最优控制理论是拉姆齐增长模型实际经济周期(RBC)模型的基础。代表性家庭选择消费路径最大化终身贴现效用 0eρtU(c(t))dt\int_0^{\infty} e^{-\rho t} U(c(t)) dt,受资本积累方程 k˙=f(k)cδk\dot{k} = f(k) - c - \delta k 约束,通过极大值原理导出凯恩斯-拉姆齐规则。在家庭经济学中,生命周期消费-储蓄决策、人力资本投资和退休规划均可纳入最优控制框架。在环境经济学中,最优排放路径和可再生资源开采的Hotelling规则均直接利用最优控制理论导出。最优控制理论因其统一处理动态权衡与约束的能力,成为现代经济学动态分析不可或缺的数学语言。