ARTICLE

最优控制

最优控制(Optimal Control)是现代控制理论的核心分支之一,研究如何在满足系统动态约束的前提下,选择控制输入以优化某个性能指标。该理论起源于20世纪50年代,以庞特里亚金极小值原理(Pontryagin's Minimum Principle)和贝尔曼动态规划(Dynamic Programming)为两大支柱,广泛应用于航空航天、机器人、经济学

浏览 4 更新 2025-11-08

最优控制(Optimal Control)是现代控制理论的核心分支之一,研究如何在满足系统动态约束的前提下,选择控制输入以优化某个性能指标。该理论起源于20世纪50年代,以庞特里亚金极小值原理(Pontryagin's Minimum Principle)和贝尔曼动态规划(Dynamic Programming)为两大支柱,广泛应用于航空航天、机器人、经济学、过程控制等领域。

基本问题描述

最优控制问题通常由以下要素构成:状态变量 x(t) \mathbf{x}(t) 描述系统在时刻 t t 的状态;控制变量 u(t) \mathbf{u}(t) 是施加于系统的输入;系统动力学由状态方程 x˙(t)=f(x(t),u(t),t) \dot{\mathbf{x}}(t) = f(\mathbf{x}(t),\mathbf{u}(t),t) 描述;性能指标或称代价泛函为 J=ϕ(x(tf),tf)+t0tfL(x(t),u(t),t)dt J = \phi(\mathbf{x}(t_f),t_f) + \int_{t_0}^{t_f} L(\mathbf{x}(t),\mathbf{u}(t),t)\,dt ,其中终端代价 ϕ \phi 和运行代价 L L 共同衡量控制效果。目标是找到最优控制律 u(t) \mathbf{u}^*(t) 使 J J 取极小值。

庞特里亚金极小值原理

庞特里亚金极小值原理是最优控制的必要条性条件,由俄罗斯数学家列夫·庞特里亚金于1956年提出。其核心思想是引入协态变量(costate variables)λ(t) \boldsymbol{\lambda}(t) 和哈密顿函数 H=L+λTf H = L + \boldsymbol{\lambda}^T f ,通过求解两点边值问题得到最优轨迹。必要条件包括:协态方程 λ˙=H/x \dot{\boldsymbol{\lambda}} = -\partial H/\partial \mathbf{x} 、横截条件 λ(tf)=ϕ/x(tf) \boldsymbol{\lambda}(t_f) = \partial \phi/\partial \mathbf{x}(t_f) ,以及哈密顿函数在最优控制下的极小化条件 u=argminuH \mathbf{u}^* = \arg\min_{\mathbf{u}} H 。该原理适用于控制受约束的情况,是处理工程最优控制问题的核心工具。

动态规划与HJB方程

贝尔曼动态规划基于最优性原理:"一个最优策略的子策略也是最优的。"从该原理出发,可推导出哈密顿-雅可比-贝尔曼方程(HJB方程):V/t=minu[L+(V/x)Tf] -\partial V/\partial t = \min_{\mathbf{u}} [L + (\partial V/\partial \mathbf{x})^T f] ,其中 V(x,t) V(\mathbf{x},t) 为值函数(value function)。HJB方程是偏微分方程,其解直接给出最优代价和最优反馈控制律。与极小值原理相比,动态规划方法提供全局最优的充分条件,但面临"维度诅咒"(curse of dimensionality)的挑战,即状态空间维数增长导致计算量指数爆炸。

线性二次型调节器

线性二次型调节器(LQR)是最优控制中最重要的解析可解特例。对于线性系统 x˙=Ax+Bu \dot{\mathbf{x}} = A\mathbf{x} + B\mathbf{u} 和二次型代价 J=(xTQx+uTRu)dt J = \int (\mathbf{x}^T Q \mathbf{x} + \mathbf{u}^T R \mathbf{u})\,dt ,最优控制律为线性状态反馈 u=R1BTPx \mathbf{u}^* = -R^{-1}B^T P \mathbf{x} ,其中 P P 满足黎卡提微分方程(Riccati equation)。LQR具有良好的鲁棒性——具有至少60度的相位裕度和无限幅值裕度,因而在实际工程中广泛使用。

应用领域

在经济学中,最优控制用于求解经济增长模型、资源开采问题和货币政策优化。在机器人领域,轨迹优化与模型预测控制(MPC)都依赖最优控制理论。在航空航天工程中,火箭发射轨迹优化、卫星轨道转移和无人机路径规划均是最优控制的经典应用。此外,强化学习中的策略梯度方法也与最优控制中的极小值原理和HJB方程有深刻联系。

总之,最优控制理论为动态系统的最优决策提供了严谨的数学框架和实用的计算方法,是连接经典控制理论与现代智能控制的桥梁。