极大值原理
四.极大值原理和哈密尔顿-雅各布理论
在前面章节,我们利用古典变分解决了许多问题[1]。提出了关于标量和矢量的欧拉拉格朗日方程的推导。们讨论了相关的贯截条件以及,如果存在不等式约束我们所面临的很多困难。几个简单的最优控制问题是他的状态及其解。在本章中,我们要重新审视在前面章节中提出的许多问题,并获得其中一些更普遍的解法。此外,我们将进一步介绍针对用前面章节中的方法不能方便地公式化的一些问题的解法。
基于此,我们用哈密顿函数方法介绍变分演算博尔扎公式。这将引导我们进行庞特里亚金最大值原理和相关的贯截条件[2-5] 证明。而后我们将着手探讨哈密尔顿- 雅各布方程[2-14],它相当于贝尔曼连续动态规划方程。最后,我们将简短介绍动态规划的一些限制。提出说明这种方法的例子。许多用极大值原理能够公式化并给出解的问题,我们将留在下一章讨论。
当终端时刻不固定,且控制向量和状态向量不一定是光滑函数时,为了让我们的方法更接近最优理论,我们必须较详细地考虑这些问题的起始变量。
4.1关于终端时间不固定函数的变分法
现在我们把3.6节介绍的变分法扩展到未给定终端时间的问题中。考虑
(4.1-1)
对于所有容许轨迹集。让 为最优轨线x对应终端时间。与偏离最优轨线的每个扰动h对应的是在终端时刻的扰动 。让第一变量 是
(4.1-2)
的一部分, 在h和 是线性的。将式(414)代入式(412),取线性在 (在 , ,和 )并且进行一般分部积分以减少依赖于 的条件到依赖于 条件,我们得出:
,(4.1-3)
为了方便的,在此我们假设,初始条件是固定,即 。
为了把方程(4.1-3)重新整理成方便的形式,我们采用下面记法。我们定义
(4.1-4)
在 泰勒级数展开中,我们注意到, 近为在 和 是线性的 。将式 (414)代入式 (413)和重新整理,一次变分为
(4.1-5)
在我们的工作中,为了方便我们定义一数量,称为哈密尔顿:
, (4.1-6)
此处哈密尔顿不是 的函数; 和 称典型变项。根据汉密尔顿,方程(411)的一次变分式 (415)变为
。 (4.1-7)
为建立极小值必要条件,必须消去式(4.1-5)与(4.1-7)中积分环节,并且如从Eq (4.1-7)中获得贯截条件
(4.1-8)
是满意的。
4.2魏尔-艾尔德曼条件。
至在我们目前的发展止,被约束容许轨迹是关于x和t连续可微的。这些泛函约束对所有容许轨迹往往是不符实际的限制,如下面的例子所述。在这个例子中,一种最优容许解是不存在; 但是,如果容许轨线的泛函约束充分地放宽,一条最
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
