适用于一次性和可重复使用运载器的最优控制方法概述
- 格式:doc
- 大小:727.00 KB
- 文档页数:28
可重复使用运载技术分析与建议
齐环环;郝京辉;韩虹;路晓红
【期刊名称】《中国航天》
【年(卷),期】2022()5
【摘要】随着国际航天产业的发展,研制低成本、高可靠、使用方便灵活的可重复使用运载器(RLV)是航天技术发展的重要方向之一。
目前航天运载技术回收目标有两种;一种是整个舱段的回收,如太空探索技术(SpaceX)公司火箭助推级回收;另一种是关键部件的回收,如联合发射联盟公司回收一级发动机的方案。
回收方式包括垂直返回、带翼飞回、空中捕获、伞降回收等。
以液氧甲烷为推进剂的火箭发动机具有高比冲、低成本、低积碳、冷却不结焦、可重复使用等特点,多个国家都在开展相关研制工作。
【总页数】7页(P64-70)
【作者】齐环环;郝京辉;韩虹;路晓红
【作者单位】北京航天动力研究所
【正文语种】中文
【中图分类】F42
【相关文献】
1.垂直返回重复使用运载火箭技术分析
2.欧洲未来的可重复使用运载器:FLTP(未来运载器技术计划)
3.重复使用运载火箭栅格舵选型设计与工艺方案研究
4.重复使用运载器着陆滑跑距离估算方法研究
5.可重复使用运载器相关技术专利分析
因版权原因,仅展示原文概要,查看原文内容请购买。
第7章 最优控制内容提要最优控制是现代控制理论的重要组成部分。
它所研究的对象是控制系统,中心问题是给定一个控制系统,选择控制规律,使系统在某种意义上是最优的。
这一章介绍了最优控制问题及一些基本的求解方法,如变分法、最大值原理和动态规划等。
为最优控制系统的设计,特别是线性二次型性能指标和快速控制提供方法和理论基础。
关于求解最优控制的变分方法,介绍了泛函与变分法基础,欧拉方程,横截条件,含有多个未知函数泛函的极值,条件极值等;关于最大值原理,介绍了古典变分法的局限性,最大值原理基本叙述,变分法与极大值原理的异同等;关于动态规划,介绍了多级决策过程与最优性原理,离散系统动态规划,连续系统动态规划,动态规划与最大值原理的关系等;还介绍了线性二次型性能指标的最优控制问题,包括状态调节器、输出调节器、跟踪问题,以及快速控制问题和综合问题。
这章研究的内容是最优控制中最基本的,也是必需掌握的。
无论将来从事研究还是从事实际工作都是必不可少的。
习题与解答7.1设有一阶系统x x u =-+,3)0(=x 。
试确定最优控制函数()u t ,在2t =时,将 系统控制到零态,并使泛函220(1)d J u t =+⎰,取极小值。
解 作泛函2200[1()]d J u x x u t λ=+++-⎰写出泛函0J 的欧拉方程0 0u u x x F F uF F t ∂⎧-=⎪⎪∂⎨∂⎪-=⎪∂⎩推出20u λλλ-=⎧⎨-=⎩ 与状态方程x x u =-+联立求得111222ttt tc e c u e c x c e e λ-===+代入边界条件()()03, 20x x ==得122212322c c cc e e -+=+=解之得2212222263, e e c c e e e e----==--故212232t tc e u e e e e---==- □7.2 一质点沿曲线()y f x =从点(0,8)运动到(4,0),设质点的运动速度为x ,问曲线取什么形状,质点运动时间最短?解 因为d , d d sx s x t== 所以t x =⎰由欧拉方程d0d d 0d y y F F tt -=⎛⎫= 得0c =做变量代换,令tg ,y θ'= 代入上式,得1sin ,x c θ== 101c c ⎛⎫= ⎪⎝⎭令 ⑴因为1d tg , d cos d d yy x c xθθθ'=== 得11d tg d tg cos d sin d y x c c θθθθθθ===可推出12cos y c c θ=-+ ⑵从(1)和(2)式中消去变量θ,得()22221x y c c +-=代入边界条件,得()2222221218, 4c c c c -=+=推出125, 3c c =±=所以曲线方程为()22325x y +-= □7.3 给定二阶系统010001x x u ⎡⎤⎡⎤=+⎢⎥⎢⎥⎣⎦⎣⎦,2(0)1x ⎡⎤=⎢⎥⎣⎦。
第一章绪论1.1 引言近50年来,科学技术的迅速发展,对许多被控对象如宇宙飞船、导弹、卫星和现代工业设备与生产过程的性能提出了更高的要求,在许多情况下要求系统的某种性能指标为最优。
这就要求人们对控制问题都必须从最优控制的角度进行研究分析和设计。
最优控制理论是现代控制理论的重要组成部分。
其形成与发展奠定了整个现代控制理论的基础。
早在20世纪50年代初九开始了对最短时间控制问题的研究。
随后,由于空间技术的发展,越来越多的学者和工程技术人员投身于这一领域的研究和开发,逐步形成了较为完整的最优控制理论体系。
最优化问题就是根据各种不同的研究对象以及人们预期要达到的目标,寻找一个最优控制规律,或设计出一个最优控制方案或最优控制系统。
最优控制理论研究的主要问题是:根据已建立的被控对象的时域数学模型或频域数学模型,选择一个容许的控制律,使得被控对象按预定要求运行,并使给定的某性能指标达到最优值。
从数学的观点来看,最优控制理论研究的问题是求解一类带有约束条件的泛函取值问题,属于变分学的理论范畴。
然而,经典变分学理论只能解决容许控制属于开机的一类,为适应工程实践的需要,20世纪50年代中期出现了现代变分理论。
在现代变分理论中最常用的两种分法是动态规划和极小值原理。
动态规划时美国学者R.E贝尔曼于1953-1957年为了解决多级决策问题的算法而逐步创立的。
最小值原理时前苏联科学院院士π.C.庞特里亚金与1956年-1958年间逐步创立的。
近年来,由于数字计算机的飞速发展和完善,逐步形成了最优控制理论中的数值计算法,参数优化方法。
当性能指标比较复杂或者不能用变量或函数表示时,可以采用直接搜索法,经过若干次迭代,都所到最优点。
常用的方法有邻近极值法、梯度法、共轭梯度法及单纯形法等。
同时由于可以把计算机作为控制系统的一个组成部分,以实现在线控制,从而使最优控制理论的工程实现成为现实。
因此,最优控制理论提出的求解方法,既是一种数学方法,又是一种计算机算法。
本科毕业设计英文翻译专业名称飞行器设计与工程学生姓名郭旭指导教师李新国完成时间2010-04-08本科毕业设计英文翻译指导教师评阅意见学生姓名:郭旭班级:2163 得分:适用于一次性和可重复使用飞行器的最优控制方法概述——Nicolas Berend, Christophe Talbot摘要飞行器轨道优化是一项复杂的工作,尤其是考虑到研究可重复使用飞行器时提出的特殊的问题时。
部分困难来自组成飞行器任务的轨道弧圈的不同的特性(约束和控制可能不一样)。
另一些困难某些情况下来自对上升和再入段之间阶段进行全局优化必要性。
最后,用于这项工作的优化工具应该是宽范围、稳定的,因为对于可重复使用飞行器的研究经常涉及很多不同的概念,也有很多不同的轨道情况(比如放弃任务的设定)。
本文的目的就是在飞行器轨道优化的大框架内给出不同的应用于法国CNES和ONERA的用于解决优化控制问题的方法。
这些方法都是对经典优化方法的有利应用,其设计目的是涵盖一次性飞行器和可重复使用飞行器的轨道计算的需求。
发布的第一个优化工具是OPTAX,用的是间接打靶方法。
发布的第二个和第三个工具是CNES的ORAGE和ONERA的FLOP/OLGA,用的是两个不同的梯度变量的方法。
本文描述了这些工具背后的方程和方法论以及其优缺点。
引言对于空间运输而言轨道优化是一件不可避免的事。
自从空间探索开始以来随着飞行器(导弹、火箭、航天飞机和再入兵器等)和任务的进化发展了非常多的优化方法,详见参考文献【2】。
为了为未来飞行器体制做好准备人们正在研究部分或者全部的可重复使用飞行器。
从构架和技术的角度来看,这种飞行器增加的复杂性很明显,从轨道优化的角度来看也是这样的。
就技术来讲,飞行器的任务是由多重的阶段组成的,以分支路线的方式组合(多段再入的情况),具有不同的动态特性和控制特性。
历史上,欧洲曾开发了很多工具来解决一个或几个同类问题。
DIAMANT, EUROPA和ARIANE对这些工具的继承给我们带来了稳定的具有竞争力的用于传统一次性飞行器的程序,但是这些工具有时并不适用与可重复使用飞行器。
结果就是人们使用了更多的工具和方法。
本文中,我们对当今CNES和ONERA的最常用的工具进行了概述。
第一个是OPTAX,使用的是间接打靶方法。
发布的第二个和第三个工具是CNES 的ORAGE和ONERA的FLOP/OLGA,用的是两个不同的梯度变量的方法。
1. 间接打靶法:OPTAX: Ariane 轨道优化(CNES )OPTAX 是Ariane 轨道和所有一次性飞行器上升轨道的主要的优化工具,在具有常值攻角或配平攻角的大气阶段的限制范围内也可以用于可重复使用飞行器。
OPTAX 是基于Pontryagin 最大化原则的直接应用。
事实上,这个原则仅仅应用于大气层以外的轨道圆弧(因为我们可以容易的得到控制的显示表达)。
大气层被参数化的优化。
1.1 该类问题的参数我们考虑一下具有初始条件的一般情况,其包含参数p 、过渡约束q 、最终约束r 和自由最终时间。
这里的初始时间是opt t ,是最有控制的开始日期(空气动力可以忽略时的时刻是最典型的时刻)。
该问题的目的是将性能指数降到最低:这里的目标函数是Mayer 形式的是因为对于上升段我们很少用整体的标准的缘故。
状态向量()X t 是由坐标、速度向量和参数k a (有效载荷质量、斜坡阶段持续时间、倾斜速度等)组成的。
控制量()u t 描述了推力矢量的方向,它是与飞行器的轴线是在同一条线上的。
最小值服从以下条件:要注意0a 是在之前的非最有控制阶段opt t (基本上是大气段)起作用的参数。
()opt x t 处的状态向量完全由0a 决定。
过渡约束可能发生在优化时间为时。
动态方程如下:t之后空气动力被忽略),M为质量(它是时间的函数)。
F代表推力和重力(opt参数a不随时间变化。
k1.2 优化条件与拉格朗日方程的形式相似,我们构建了提高的性能系数如下,详见参考文献【6】。
为了简化方程我们已经忽略了过渡约束项。
我们引入拉格朗日乘子v作为最λ作为动态约束。
其方程如下:终约束和状态向量伴随向量()t需要的优化条件一如下设定给出:λ如下:为方便起见,我们通常定义Hamiltonian函数(,,,)H X u t如果除去中的各项,我们就得到必要的条件:必须选取控制变量的Pontryagin最大化原则状态来使Hamiltonian函数在随时都为最小。
以下是最小化方程:1.3t时的横向条件opt初始约束(1.3)可以写作:这使得横向条件可以重新写作如下形式:以及和t之前)的伴随向这种关系给出了与位置和速度伴随向量相关的参数(在opt量的初始值。
然后就有:1.4 伴随方程考虑到如1.6式所述的运载器的动力学,我们可以得到:我们计算了与状态向量相关的动力学导数。
很多项可以容易的去掉。
伴随方程(1.11)变成:我们可以认为推力不再取决于高度的变化。
那么第一项就成了重力加速度的函数。
和表述为已考虑参数的函数。
1.5 最小化方程最优控制将Hamiltonian函数所有可接受的控制都减到了最小。
仅有的取决于控制的项是。
最小化Hamiltonian函数就等价于最小化,这意味着u和速度伴随向量是在同一条直线上而且方向相反的。
该式给出了轨道上每个点的最有控制的显示表达。
要注意如果空气动力不可忽略的话就不可能得到这么简易的表达式了。
1.6过渡约束由Pontryagin 原则可得:如果约束的时间m t 不是恒定的,应该加入一个附加方程来求解最优值:与过渡系数j γ和m t 相关的拉格朗日系数j u 是该问题的未知量。
因为这些系数在横向条件下的作用并不很明显,它们应该被当成系数a 来考虑。
对于每一个相关的j u 都有一个代表着j u 变量对性能提高的影响的伴随向量系数在过渡约束与质量下降相关的情况下就可以明确的确定伴随矩阵的阶跃。
系统的Hamiltonian 函数依然是连续的(约束并不取决于时间)而其仅有加速度Γ的变化:然后我们就要就要解以下以 为未知量的方程:这可以通过牛顿方法解决。
1.7最终非线性方程组我们需要积分以下方程组:初始条件是,最优控制率为,未知量:最终,我们得到一个参数(7)p q r +++和(6)p q r +++未知的方程。
多余的未知量是f v ,是随意变化的。
为了关闭系统,我们引入了初始速度时伴随矩阵向量的附加状态:该状态本质上式对f v 的设定。
现在该问题就等价于0()0F S =的一个方程组。
该方程通过牛顿迭代的方法解决,步长元素为α:这种方法的收敛半径是有限的,初始条件很重要。
下一段将阐述用于确定和v 的方法。
1.8 使用最小平方法的初始假设 用户需要定义姿态定律和参数(包括相应于伴随矩阵的阶跃)的简化(不一定是优化)。
轨道(仅有状态动态特性)是通过积分得到的,与状态向量相关的最终约束的梯度和系能指标是由计算得到的。
在横向条件下,可以确定相关的(特殊的)伴随矩阵方程组(未考虑拉格朗日乘子):1r +个方程组是随着状态和伴随矩阵向量向后积分的。
伴随矩阵方程组是线性的,因此任何对于伴随矩阵方程组的特殊线性联立的解也是具有等同于最终的特殊线性联立解的一个最终解的伴随矩阵方程组的解。
最终的拉格朗日乘子i v 是以使轨道上前向积分和后项积分不同的仅仅某些点处最小化的方法搜索的。
对于这些观测点(s t 时),我们有如下关系:观测点的数目必须要比我们要确定的系数的数目大。
超静定问题可以通过最小平方条件和简化关系的方法解决。
1.9 其他特性OPTAX 是CNES 和ARIANESPACE 在各种工程中非常常用的程序(还有Ariane, Future Launchers,Foreign Launchers comparison 等)。
因此对这种方法实施了很多改进:——参数优化(代替优化控制),包括Ariane 5种运载器的制导律——有助于初始设定、提高稳定性、处理多种情况或再次点火任务的混合打靶 ——对由惯性参考系散步引起的导航误差的估计,应用变化传播的方法 ——6自由度互联的Ariane 仿真,安全程序,观测和遥控诊断,飞行动力学程序,相关学科优化工具等1.10 该方法的优缺点——收敛的速度。
因为它的控制的显式解是速度伴随矩阵的函数,如果第一次估计和真实解相当接近的话,Optax 可以在数秒之内对一条弹道进行优化。
与初始过程相联系的快速收敛可以轻易的从一个当地解跳到另一个上去。
也很容易把OPTAX 和各学科优化工具联系起来。
——该解尽可以被几个参数记录(opt λ,k α和v )。
——控制的质量(比如没有噪声等)主要缺点是:——初始化需要经验。
初始设定值不是理论上的也不是凭直觉推断的,对一个新的飞行器完全优化一条新的轨道是一件相当麻烦的事。
——应用新的约束或标准是一件很难的事,为了增加搜索的精确性(以及成功的几率)需要很多派生项和进一步的可用分析(跟有限的差异相比)。
——该方法不适用于复杂的动态系统,因为其作为伴随矩阵函数的控制的显式解不容易寻找(例如气动力控制)。
2.扩展梯度法:ORAGE:使用外部扩展梯度法的大气再入优化ORAGE应用于大气再入仿真。
以前CNES用的很多再入仿真例如反馈控制或同约束剖面的动态求逆(Harpold和Graves方法,详见参考文献【5】)。
如今ORAGE 可以提供考虑达到飞行器最大性能目标的可用的完全优化控制。
2.1 问题的各方面Bolza形式的性能指标包括积分项和最后时刻估计的数量:最小值取决于以下条件:例如,价值函数可以是飞行器的距离(横向或纵向),到达着陆点的距离,最终速度或热流的积分。
最终约束仿真结束时的影像参数(模块,速度的倾斜和方位,纬度,经度等)。
中间约束也是可变的形式:动力学,热量,与控制能力或性能保留相关(滚转)等。
飞行器的运动是由以下的动态变量定义的(半径,纬度,经度,速度,轨道倾角,方位角和质量):控制变量一般包含以下的姿态角(参见图1):—— :攻角——u:倾斜角2.2 优化条件我们把性能系数J提高的性能系数ˆJ定义如下:需要的优化条件是由微分方程得到的。
通过区分我们得到J的灵敏度方程:同样的方式,我们引入与约束相关的伴随矩阵向量,而且推导出敏感方程如下:伴随矩阵向量选以结束f dx 和x δ的方式:以及ˆdJ变成:如果控制u 和最终时间f t 已经经过了优化,那么ˆdJ 对于任何无穷小变量fdt 和u δ就无意义了。
最终问题变为:以及横向条件和伴随矩阵方程(2.11)和最终约束(2.4)。
2.3 过渡约束过渡约束可以以同样的方式作为最终约束加入。
对于每个约束(是在j t 时刻的第k 级约束)都已一个伴随矩阵:结果,我们得到了需要的附加条件:2.4 梯度方法该问题是通过一阶梯度方法解决的(详见参考文献【6】)。